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R^drence du dossier du ddposant ou 
du mandataire 

BCT000059/BLO 


POUR SUITE ^^^^ ^ notification de transmission du rapport de recherche Internationale 

(formulaire PCT/ISA/220) et, le cas dchdant. le point 5 ci-aprds 
ADONNER ^ 


Demande intematlonale n"* 
PCT/FR 00/01904 


Date du d^dt lntemational(/our//nojs/a/v)^J 

04/07/2000 


(Date de priority (la plus ancienne) 
(jour/mois/annde) 

05/07/1999 


Ddposant 

MATRA NORTEL COMMUNICATIONS 



Le present rapport de recherche intematlonale, dtabli par radministration charge de la recherche intemaUonale, est transmis au 
ddposant conformdment k rartide 18. Une oopie en est transmise au Bureau international. 

Ce rapport de recherche intemationale comprend 3 feuilles. 

fXI II est aussi acoompagnd tfune copie de chaque document relatif k I'^tat de la technique qui y est citd. 



1. Base du rapport 

a. En ce qui concerne la langue, la recherche intemationale a 6t6 effectude sur la base de la demande intemationale dans la 
langue dans laquelte elle a M ddposde, sauf Indication oontraire donnde sous le mdme point 

I I la recherche intemationale a dtd effectude sur ta base d'une traduction de la demande intemationale remise k {'administration, 



b. En ce qui concerne lee sequences de nuclMldes ou d'acldes amln^e divulgudes dans la demande intemationale (le cas tehdant), 
la recherche intemationale a 6t6 effectude sur la base du listage des sequences : 
I I contenu dans la demande intemationaie, sous forme dcrite. 

d4posde avec la demande intemationale, sous fonme d6chiffrable par ordinateur. 
remis ult^rieurement k radministration, sous forme ecrite. 
remis ultdrieurement k radministration, sous forme d^iffrable par ordinateur. 



□ 
□ 
□ 
□ 

□ 

□ 
□ 



La d^laration, selon laquelle le listage des sequences pr^entd par dcrit et foumi ultdrieurement ne vas pas au-del^ de la 
divulgation faite dans la demande telle que ddposde, a et6 foumie. 

1-a declaration, selon laquelle les informations enregistrdes sous forme ddchiffrable par ordinateur sont identiques & oelles 
du listage des s^uences prdsentd par dcrit, a dtd foumie. 

11 a ^t^ e8tlm6 que certalnee revendlcations ne pouvalent pas faire I'objet d'une recherche (voir le cadre I). 
II y a absence d'unlt^ de I'Inventlon (voir le cadre II). 



4. En ce qui concerne le titre, 

Pn ie texte est approuvd tel qu'il a dtd remis par le d^osant 

I I Le texte a M 6tab\\ par radministration et a la teneur suivante: 



5. En ce qui conceme Tabr^g^, 

lY] le texte est approuvd tel qu'il a dtd remis par le d^osant . 

□ le texte (reproduit dans le cadre III) a M dtabli par radministration conformdment k la regie 38.2b). Le d^osant peut 
presenter des observations k radministration dans un deiai d'un mois k compter de la date d'expedition du present rapport 
de recherche Internationale. 

6. La figure des desslns k publier avec I'abrdgd est la Figure n** X5- 



rn suggdrdeparleddposant. Q Aucune des figures 

n parce que le d6posant n'a pas sugg6r6 de figure. ^ publier. 

pn parce que cette figure caract^rise mieux rinvention. 
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RAPPORT DE RE< 



INTERNATIONALE 




PCT/FR 00/01904 



A. CLASSEMENT DE L'OBJET DE LA DEMANDE 

CIB 7 610119/02 



Selon la classification intemationaJa dsa brevets (CIB) ou & la fbia aek>n la dassilication nationale et la CIB 



B. DOMAINES SUR LESOUELS LA RECHERCHE A PORTE 



Documentation mtnimale consuttto (aysttoie da daaeification auivi dea symbolea da dasaemem) 

CIB 7 GIOL 



Oocumantation consults autre qua la documentation minima^9 dans la meaurs ou cee documents rat^vent des domaines sur lesquais a portd la recherche 



Base de donn^es ^ectronique oonsuttte au coure de la recherche tntemationaie (nom de la base de donn^es. et si realisable, termes da recherche utilisto) 

EPO-Internal , WPI Data, INSPEC 



C. DOCUMEKTS CONSIDERES COMME PERTINEKTS 



Cat^gorie ' 



Identification des documents crt68, avoc. le caa 6ch^ant, I'irKficatior des passagee pertinents 



no. des reveoc£ cations vis6ee 



ET 



65 



us 5 878 388 A (NISHIGUCHI MASAYUKI 
AL) 2 mars 1999 (1999-03-02) 

figures 2A,2B 
colonne 5, ligne 63 -colonne 6, llgne 

9, llgne 27-39 

10, ligne 24-44 
1-5 
36-52 
42-52 

35 -colonne 34, ligne 8 



1,4,6.7, 
16 

5.8.9 



colonne 
colonne 
colonne 
colonne 
colonne 
colonne 



11, 
11, 
12, 
33. 



1 Igne 
1 Igne 
1 Igne 
Itgne 



US 5 911 130 A (SHIMIZU ET AL) 
8 juin 1999 (1999-06-08) 
colonne 4, ligne 48-65; figure 7 
colonne 7, ligne 49 -colonne 8, ligne 



37 



8.9 

11,12 



en 



Voir la suite du cadre C pour (a fin da la liste dee documents 



Les documents de femllles da biewsts aont frxftqu^a en annexe 



* Cat^goifes sp^alea de documents oMsi 

*A* documem ddfinissant {'6tat gdn^rai da la technique, non 

oonsid6r6 comme partlculidrement pertinent 
*E' document ant^rieur. mala pubH^^ la date deddpOtintemational 

ou aprto oette date 
V document pouvant fster un doute sur une raverKiication de 

priortt^ ou dt6 pour determiner la date da publication d'urte 

autre citation ou pour une ratson spteiale (telle qu'indiqute) 

"O* document se r^fdrant ^ une divulgation orale. k un usage, h 
une exposition ou toua autres moyens 

■p* document pub&6 avant (a data de ddp6t Intematianai, maia 
poatMeurement h la date da priority isvendiqute 



T documerrt uttdrfeur public aprte la date de ddpdt intemationai ou la 
date de priority et n appartertenant pas k V6tst de la 
technique pertinent, mais citd pour oomprendre le princtpe 
ou la thtorie oonatituant la base de llnvention 

'X* documerrt pajticu!i6rement pertinent; Tinven tion revendiqu^ ne peut 
dtre considMe comme nouvelle ou oomme imptiquant une activity 
inventive par rapport au document considdr^ isol^ment 

"Y* document paiticufidrement pertinent; Hnven tion revendiqute 
ne peut 6tre oonsid^r^e comme impliquant une activity nventive 
loreque le document est asaoci6 ^ un ou ptusisuis autres 
documents ds mdme nature, cette combcnaison dtant dvldsnte 
pour une peraonne dU metier 

*&* document qui fait partlede la mdmefBmlDede brevets 



Date ft laquella la recherche intamationale a M effectivement achevte 



6 septembre 2000 



Date d'expdcfltion du piteent rapport de recherche intemationaie 



14/09/2000 



Nomet 



postale de I'admintstration dhst^i6e de la recherche intemfitioiuOe 

Office Europe des Brevets. PB. 5616 Patentlaan 2 

ML- 2280 HV Rijswijk 

Tel. (+31-70) 340-2040. Tx. 31 651 ©po nl. 

Fax: (+31-70) 340-3016 



Forwstionnaire autoris^ 



Quelavoine, R 
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RAPPORT DE^CHERCHE INTERNATIONAL^^ 



Dm. .dtt Intamatlonftio No 

PCT/FR 00/01904 



C^sulto) DOCUMENTS CONSIDERES COMME PERTTNEffrS 
Cat6gorie 1 ktentmcstlon des document* cftte, avBC,l« ca* 



Mttem, rimSeaUendM pMtagM pefttnent* 



no. dM revandttation* visie* 



DATABASE INSPEC 'en ligne! 
INSTITUTE OF ELECTRICAL ENGINEERS, 
STEVENAGE, GB; 

LAGLER A ET AL: "Real -time fixed-point 
DSP-implementation of spectral 
substraction algorithm for speech 
enhancement In noisy environment" 
Database accession no. 6604117 
XP002139930 
abrege 

& 9TH INTERNATIONAL CZECH - SLOVAK 
SCIENTIFIC CONFERENCE. RADIOELEKTRONIKA 
99. CONFERENCE PROCEEDINGS, PROCEEDINGS OF 
9TH INTERNATIONAL CZECH - SLOVAK 
SCIENTIFIC CONFERENCE. RADIOELEKTRONIKA 
99, BRNO, CZECH REPUBLIC, 27-28 APRIL 
1999, 

pages 186-189, 
1999, Brno, Czech Republic, Brno Univ. 
Technol, Czech Republic 
ISBN: 80-214-1327-1 

AHMADI S ET AL: "New techniques for 
sinusoidal coding of speech at 2400 bps" 
CONFERENCE RECORD OF THIRTIETH ASILOMAR 
CONFERENCE ON SIGNALS, SYSTEMS AND 
COMPUTERS (CAT. N0.96CB36004), CONFERENCE 
RECORD OF THE THIRTIETH ASILOMAR 
CONFERENCE ON SIGNALS, SYSTEMS AND 
COMPUTERS, PACIFIC GROVE, CA, USA, 3-6 
NOV. 1996, 

pages 770-774 vol.1, XP002138769 
1997, Los Alamitos, CA, USA, IEEE Comput. 
Soc. Press, USA 
ISBN: 0-8186-7646-9 

page 773, colonne de droite, ligne 10-30 

EP 0 893 791 A (DIGITAL VOICE SYSTEMS INC) 
27 Janvier 1999 (1999-01-27) 

abrege 

page 2, colonne 48 -page 3, colonne 1 

page 6, ligne 21-29 

page 7, ligne 36-43 



10 



1.2,4,6, 
7,10,13, 
16 



Foanulak* PCT/ISMStO (auto da k dauxMim touM*) OulM 1992) 



page 2 de 2 



INTERNATIONAL SEARCH REPORT 



m lional Application No 

PCT/FR 00/01904 



A. CLASSIFICATION OF SUBJECT HATTER 

IPC 7 G10L19/02 



Aooording to International Patent Claaatfication (IPC) or to both national classification and IPC 



B. FIELDS SEARCHED 



Minimum documentation eearched (classification system fottcwed by classification symbols) 

IPC 7 GIOL 



Documentation searched other than minimum documentation to the extent that such documents are included tn the fields searched 



Bectronic data base consulted during the international search (name of data base and. where pmctical, search terms used) 

EPO-Internal , WPI Data. INSPEC 



C. OOCUUENTS CONSIDERED TO BE RELEVANT 



Cotagory * 


Citation of document, with indlGation, where appropriate, of the relevant paooaQoo 


Relevanr to dabn No. 


X 


US 5 878 388 A (NISHIGUCHI MASAYUKI ET 


1,4,6,7. 




AL) 2 March 1999 (1999-03-02) 


16 


Y 


figures 2A,2B 


5,8.9 




column 5, line 63 -column 6, line 65 






column 9, line 27-39 






column 10, line 24-44 






column 11, line 1-5 






column 11, line 36-52 






column 12, line 42-52 






column 33, line 35 -column 34, line 8 




Y 


US 5 911 130 A (SHIMIZU ET AL) 


8.9 




8 June 1999 (1999-06-08) 




A 


column 4, line 48-65; figure 7 


11.12 




column 7, line 49 -column 8, line 37 






V— 





m 



Further documents are Psted in the continuation of box C. 



Patent family members are Osted in annex. 



* Special categoriee of cited documerrts : 

*A* document defining the generaf state of the art which is fwt 
cofttidered to be of particular relevance 

*E* earlier document but pubOshed on or alter the international 
filing date 

*L* document wNch may throw doufate on priority claim(s)or 
wtuch is cited to establish tfte pulalication date of another 
citation or other special reason (as specified) 

*0* document rsferring to an oral (fiadosure. use, exhUtionor 
other means 

*P* document published prior to the International filing date but 
later than the priority date daimed 



T* later document published after the intemationai filing date 
or priority date aiKl not in conflict with ttie application tHit 
citad to understand the princtple or theory underlying the 
invention 

')(* documem off particular rslevar^oe: the ciaimed invention 
cannot t>e considerBd novel or cannot be considerBd to 
involve an inventive step wt^ the docun>ent is taken alone 

"Y' document of particular re levari; the claimed invention 

canrwt be considered to invoK/e an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person sidUed 
in the art. 

*&* document member of the same patent family 



Date of the actual completion of the intemationai search 

6 September 2000 


Date of mailing of the international aearoh report 

14/09/2000 


Name and mailing address of the ISA 

European Patent Office. P.B. 5616 Patentlaan 2 
NL-2280HVRiiBwijk 
Tel. (4d1-70) 34O..204O. Tx. 31 651 epo nl. 
Fax: i-tOt-JO) 340-3016 


Authorized officer 

Quelavoine, R 



FoimPCT/ISAAlOO 



t)(July 1Qfi2) 
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ATIONAL SEARCH REPORT 



Inti ional Application No 

PCT/FR 00/01904 



C^Conttnuatlon) DOCUMENTS CONSIDERED TO BE RELEVANT 



Category " Citation oi documont with indk;atjon.where appropriaie, of the relevant passages 



Relevant to daim No. 



DATABASE INSPEC 'Online! 
INSTITUTE OF ELECTRICAL ENGINEERS, 
STEVENAGE, GB; 

LA6LER A ET AL: "Real-time fixed-point 
DSP-implementation of spectral 
substraction algorithm for speech 
enhancement in noisy environment" 
Database accession no. 6604117 
XP002139930 
abstract 

& 9TH INTERNATIONAL CZECH - SLOVAK 
SCIENTIFIC CONFERENCE. RADIOELEKTRONIKA 
99. CONFERENCE PROCEEDINGS, PROCEEDINGS OF 
9TH INTERNATIONAL CZECH - SLOVAK 
SCIENTIFIC CONFERENCE. RADIOELEKTRONIKA 
99, BRNO, CZECH REPUBLIC, 27-28 APRIL 
1999, 

pages 186-189, 
1999, Brno, Czech Republic, Brno Univ. 
Technol , Czech Republic 
ISBN: 80-214-1327-1 

AHMADI S ET AL: "New techniques for 
sinusoidal coding of speech at 2400 bps" 
CONFERENCE RECORD OF THIRTIETH ASILOMAR 
CONFERENCE ON SIGNALS, SYSTEMS AND 
COMPUTERS (CAT. N0.96CB36004), CONFERENCE 
RECORD OF THE THIRTIETH ASILOMAR 
CONFERENCE ON SIGNALS, SYSTEMS AND 
COMPUTERS, PACIFIC GROVE, CA, USA, 3-6 
NOV. 1996, 

pages 770-774 vol.1, XP002138769 
1997, Los Alamitos, CA, USA. IEEE Comput. 
Soc. Press, USA 
ISBN: 0-8186-7646-9 

page 773, right-hand column, line 10-30 

EP 0 893 791 A (DIGITAL VOICE SYSTEMS INC) 
27 January 1999 (1999-01-27) 

abstract 

page 2, column 48 -page 3, column 1 
page 6, line 21-29 
page 7, line 36-43 
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1.2,4,6, 
7.10,13, 
16 



Foim PCT/ISAA10 (eondnuction of eaoond ehaot) (July 1962) 



page 2 of 



2 



INTERNATIONAL SEARCH REPORT 

Inform^Sli^f n patont family membore 



Patent document 

crted in search report 



Publication 
date 



Intemattonal Application No 

PC^h 00/01904 



Patent family 
membeits) 



Publication 
date 



US 5878388 



02-03-1999 



JP 
JP 
EP 
WO 
US 
US 



5265487 
5297894 
0590155 
9319459 
5765127 
5960388 



15-10-1993 
12-11-1993 
06-04-1994 
30-09-1993 
09-06-1998 
28-09-1999 





9711 lOU 


A 
M 




-1QQQ 


.IP 

Ur 


O^OU7/ 1 


A 




EP 


0893791 


A 


27-01- 


-1999 


US 


5226084 


A 


06-07-1993 












AU 


657508 


B 


16-03-1995 












AU 


9147091 


A 


08-07-1992 












CA 


2096425 


A 


06-06-1992 












DE 


69132013 


D 


06-04-2000 












EP 


0560931 


A 


22-09-1993 












JP 


6507252 


T 


11-08-1994 












UO 


9210830 


A 


25-06-1992 












US 


5630011 


A 


13-05-1997 












US 


5491772 


A 


13-02-1996 












US 


5247579 


A 


21-09-1993 



Form PCT/lSA/210 (patent fantf y amwO (July 1 992) 



TRAIITE DECOOPERAUON EN iVJATniERE DE BREVETTS 



Exp6diteur: L'ADMINISTRATION CHARGEE DE 

L'EXAMEN PRELIMINAIRE INTERNATIONAL 



Destinataire: 

LOISEL, Bertrand . 
CABINET PLASSERAUD 
84, rue d'Amsterdam 
75440 Paris Cedex 09 
FRANCE 



R tic 



) 



28 



Cbt Pi 



P. 20iNPTiF> 



T 



ATION DE TRANSMISSION DU 
EUIPPORT D'EXAMEN PRELIMINAIRE 
INTERNATIONAL 



(r6gle 71.1 du POT) 



Date d'exp6dition 

Oour/rm^aimSe) 26.09.2001 



R^f^rence du dossier du d^posant ou du mandataire 
BCT000059/BLO 


NOTIFICATION IMPORTAlsnE 


Demande intematlonale No. 
PCT/FROO/01904 


Date du d6pot international (jour/mois/ann6e) 
04/07/2000 


Date de priorit6 (jour/mois/ann4e) 
05/07/1999 


D6posant 

MATRA NORTEL COMMUrsliCATIONS et al. 



1. II est notlfi6 au deposant que radministration charges de I'examen pr6limlnalre international a 6tabli le rapport 
d^examen preliminaire international pour la demande Internationale et le lui transmet ci-joint, accompagn6, le 
cas ech§ant, de ces annexes. 

2. Une copie du pr6sent rapport et, le cas 6cheant. de ses annexes est transmise au Bureau international pour 
communication a tous les offices elus. 

3. Si tel ou tel office elu I'exige, le Bureau international etablira une traduction en langue anglaise du rapport {k 
I'exclusion des annexes de celui-ci) et la transmettra aux offices int6ress6s. 



4. RAPPEL 

Pour aborder la phase nationale auprfes de chaque office elu, le deposant doit accomplir certains actes (depot 
de traduction et paiement des taxes nationales) dans le delai de 30 mois k compter de la date de priority (ou 
plus tard pour ce qui concerne certains offices) (article 39.1) (voir aussi le rappel envoye par le Bureau 
international dans le formulaire PCT/IB/301). 

Losrqu'une traduction de la demande Internationale doit etre remise h un office §Iu, elle doit comporter la 
traduction de toute annexe du rapport d'examen preliminaire international. II appartient au deposant d'etablir la 
traduction en question et de la remettre directement a chaque office 6lu int§ress6. 

Pour plus de precisions en ce qui concerne les delais applicables et les exigences des offices elus, voir le 
Volume II du Guide du deposant du PCT. 



Norn et adresse postale de Tadminstration charg^e de Texamen 
preliminaire international 

Office europ6en des brevets 

JD-80298 Munich 
T6I. +49 89 2399 - 0 Tx: 523656 epmu d 
Fax:+49 89 2399-4465 



Fonctionnaire autoris6 
Benigar, M 

T6I.+49 89 2399-2996 



I 



0)i I 



Formulaire PCT/IPEA/416(juillet 1992) 
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TRAITE DBSOOPERATION EN (VIATIERraE BREVETS 

FCT 

RAPPORT D'EXAMEN PREUMIINADRE DNTERNATIOSS9AL 



(article 36 et regie 70 du FCT) 



R6f6rence du dossier du d^posant ou du 

mandataire 

BCT000059/BLO 


voir la notification de transmission du rapport d'examen 
POUR SUITE A DONNER pr61iminaire international (fomnulaire PCT/IPEA/416) 


Demande intemationale n*" 
PCT/FROO/01904 


Date du d6pot intemational (jour/mois/ann^e) 
04/07/2000 


Date de priority (jour/mois/ann^e) 
05/07/1999 


Classification intemationale des brevets (CIB) ou k la fois classification nationale et CIB 
G10L19/02 


D^posant 

MATRA NORTEL COMMUNICATIONS et al. 



1 , Le present rapport d'examen prdliminaire international, 6tabli par I'administaration charg6e de I'examen pr^linninaire 
international, est transmis au deposant conform§ment k I'article 36. 



2. Ce RAPPORT comprend 9 feuilles. y compris la presents feuille de couverture. 

□ II est accompagn§ d'ANNEXES, c'est-^-dire de feuilles de la description, des revendications ou des dessins qui ont 
§X§ modifi§es et qui servant de base au present rapport ou de feuilles contenant des rectifications faites aupres de 
I'administration charg^e de Texamen pr^limlnaire international (voir la rdgle 70.16 et I'instruction 607 des Instructions 
administratives du POT). 

Ces annexes comprennent feuilles. 



3. Le present rapport contient des indications relatives aux points suivants: 



1 




Base du rapport 


11 


□ 


Priority 


III 


□ 


Absence de formulation d'opinlon quant h la nouveautd. I'activit^ inventive et la possibility 
d'application industrlelle 


IV 


□ 


Absence d'unit§ de invention 


V 


El 


Declaration motiv6e selon I'article 35(2) quant k la nouveaut§, I'activity inventive et la possibility 
d'application industrielle; citations et explications k Tappui de cette declaration 


VI 


□ 


Certains documents cit^s 


VII 




Irregularit6s dans la demande Internationale 


VIII 




Observations relatives k la demande intemationale 



Date de presentation de la demande d'examen preilminaire 
intemationale 

10/01/2001 


Date d'ach^vement du present rapport 
26.09.2001 


Nom et adresse postale de i'administration charg6e de 
I'examen pr^liminaire international: 

^ Office europ6en des brevets 
^ D-80298 Munich 
;Sy^ T6I. +49 89 2399 - 0 Tx: 523656 epmu d 
Fax: +49 89 2399 - 4465 


Fonctionnaire autoris6 /^SSSl^^v 
Bourdier, R (f ^ )) 

de telephone +49 89 2399 21 30 



Formulaire PCT/IPEA/409 (feuille de couverture) (janvier 1994) 
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RAPPORT D'EXAMEN 
PRELIMINAIRE INTERNATIONAL 



Demande internationale PCT/FROO/01 904 



I. Base du rapport 

1 . En ce qui concerne les elements de la demande internationale (les feuilles de remplacement qui ont 6t6 remises 
k I'office r6cepteur en reponse a une invitation faite conform6ment k i'articie 14 sont consid6r6es dans le present 
rapport comme "initiaiement d^pos^es" et ne sont pas jointes en annexe au rapport puisqu'elles ne contiennent 
pas de modifications (regies 70. 16 et 70. 17)): 

Description, pages: 

1 -30 version Initiale 

Revendications, N"": 

1-16 version initiale 

Dessins, feuilles: 

1/11-11/11 version initiale 

2. En ce qui concerne la langue, tous les elements indiques ci-dessus 6taient a la disposition de I'administration ou 
lui ont §t6 remis dans la langue dans laquelle la demande internationale a §t§ d^pos^e, sauf Indication contraire 
donn^e sous ce point. 

Ces 6l6ments 6taient k la disposition de I'administration ou lui ont 6t6 remis dans la langue suivante: , qui est : 

□ la langue d'une traduction remise aux fins de la recherche internationale (selon la r6gle 23.1(b)). 

□ la langue de publication de la demande internationale (selon la r^gle 48.3(b)). 

□ la langue de la traduction remise aux fins de I'examen pr6llminaire internationale (selon la r6gle 55.2 ou 



3. En ce qui concerne les sequences de nucleotides ou d'acide amines divulguees dans la demande 

Internationale (le cas ^ch^ant), I'examen pr^limlnalre intematlonale a affectum sur la base du llstage des 



□ contenu dans la demande Internationale, sous forme ^crlte. 

□ d^posS avec la demande Internationale, sous forme d^chiff rable par ordinateur. 

□ remis ult^rieurement k I'administration, sous forme ^crlte. 

□ remis ulterieurement h Tadministration, sous fomie d6chiffrable par ordinateur. 

□ La declaration, selon laquelle le listage des sequences par 6crit et fourni ulterieurement ne va pas au-del^ 
de la divulgation faite dans la demande telle que d6pos6e, a ete fournie. 

□ La declaration, selon laquelle les informations enregistrees sous d6chiffrable par ordinateur sont identiques k 
celles du listages des sequences Presents par ^crit, a 6X6 fournie. 

4. Les modifications ont entram6 Tannulation : 



55.3). 



sequences : 
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□ de la description, pages : 

□ des revendications, n*** : 

□ des dessins, feuilles : 

5. □ Le present rapport a 6t6 formule abstraction faite (de certaines) des modifications, qui ont 6t6 consid6r6es 
comme allant au-deia de rexpos6 de I'invention tel qu'il a et6 d6pos6, comme il est indiqu6 ci-apr6s (r6gle 
70.2(c)) : 

(Toute feuille de remplacement comportant des modifications de cette nature doit §tre indiqu6e au point 1 et 
annex6e au present rapport) 



6. Observations compl6mentaires, le cas ech6ant : 



V. Declaration motivee selon I'article 35(2) quant a la nouveaute, Pactivite inventive et la possiblllte 
d'application industrielle; citations et explications a i'appui de cette declaration 

1. Declaration 

Nouveaut6 Oui : Revendications 1-5,7-15 

Non : Revendications 6,16 

Activity Inventive Oui: Revendications 2,3,13,14 

Non : Revendications 1,4,5,7-12,15 

Possibility d'application industrielle Oui: Revendications 1-16 

Non : Revendications 



2. Citations et explications 
voir feuille separee 



VII. Irregularites dans la demande Internationale 

Les irregularites suivantes, concernant la forme ou le contenu de la demande Internationale, ont ete constatees : 
voir feuille separee 



VIII. Observations relatives a la demande Internationale 

Les observations suivantes sent faites au sujet de la clart6 des revendications, de la description et des dessins 
et de la question de savoir si les revendications se fondent enti6rement sur la description : 
voir feuille separee 
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CONCERNANT LA SECTION V 



1 . L'etat de la technique le plus proche pour la revendication 1 est considere 
comme etant US-A-5 878 388, que Ton designera par D1. 

D1 divulgue une precede d'analyse d'un signal audio (signal de parole, colonne 5, 
ligne 63) traite par trames successlves de N echantillons, ponderees par une 
fenetre de Hamming (colonne 6, lignes 12-14), dans lequel on calcule un spectre 
du signal audio pondere par transformation frequentielle (colonne 6, lignes 59-65), 
et on traite le spectre pour delivrer des parametres de synthese (colonne 9, lignes 
40-47 et colonne 7, lignes 1-3), les trames successives pour lesquels on d^iivre 
des jeux de parametres presentant des recouvrements mutuels de moins de N/2 
echantillons (colonne 6, lignes 8-1 1 : longueur de la fenetre=256, recouvrement= 



La caracteristique selon laquelle on delivre en alternance des jeux complets de 
parametres et des jeux incomplets est nouvelle par rapport a D1 . 

2. Le probleme technique qu'on resout en introduisant la caracteristique nouvelle ci- 
dessus est bien entendu celui de limiter le debit de codage. 

Le document D2 = AHMADI S ET AL: 'New techniques for sinusoidal coding of 
speech at 2400 bps' CONFERENCE RECORD OF THIRTIETH ASILOMAR 
CONFERENCE ON SIGNALS, SYSTEMS AND COMPUTERS (CAT. 
NO.96CB36004), CONFERENCE RECORD OF THE THIRTIETH ASILOMAR 
CONFERENCE ON SIGNALS, SYSTEMS AND COMPUTERS, PACIFIC GROVE, 
CA. USA, 3-6 NOV. 1 996, pages 770-774 vol. 1 , XP0021 38769 1 997, Los 
Alamitos, CA, USA, IEEE Comput. Soc. Press, USA, divulgue une technique de 
codage de parole delivrant des parametres spectraux sur des trames de longueur 
fixe (page 770, "Introduction", colonne de gauche). Afin de limiter la bande 
passante du codeur, ce document propose de limiter renvoi de parametres de 
codage a une trame sur 2, les parametres manquants etant re-estimes par 
interpolation (page 773, chapitre 5, lignes 1-16). Toutes les 2 trames dans D2, le 
jeu de parametres est done incomplet puisqu'il est vide. 



96). 
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L'objet de la revendication 1 resulte done de I'introduction de I'enseignement de 
D2 concernant la reduction de debit dans le procede connu de D1 . Une telle 
juxtaposition de caracteristiques est consideree comme evidente et done 
manquant de satisfaire au eritere d'aetivite inventive. 

L'argunnent eonsistant a considerer qu'un reeouvrement des fen§tres inferieur a 
N/2 est prejudiciable a renvoi d'une trame sur deux ne peut etre retenu pour 
justifier Taetivite Inventive. En effet, 11 est parfaitement evident que plus 
respacement des fen§tres est important, plus les parametres spectraux changent 
a chaque fenetre, et done plus le codage perd en qualite, surtout si Ton cherche 
en plus, comme dans D2, a interpoler une trame sur deux. AInsi Thomme du 
metier choisira Tespacement des fenetres en connection avec I'interpolation en 
connaissance de cause, selon des eriteres resultant d'un compromis entre baisse 
de debit et quality de codage. En particulier rien ne I'empeche de choisir un type 
de codage comme revendique a la revendication 1 , ce choix etant en outre, au vu 
de I'enseignement combine de D1 et D2, le plus evident. 

3. Les caracteristiques additionnelles de la revendication 4 sont egalement connues 
de D1 (voir passages cites plus haut). Done la revendication 4 manque de 
satisfaire le eritere d'aetivite inventive, tout comme la revendication 1 . 

4. Les caracteristiques additionnelles des revendications 2 et 3 sont nouvelles et 
considerees comme non evidente au vu de I'art anterieur, et done impliquant une 
activite inventive. 

5. La caracteristique additionnelle de la revendication 5 est nouvelle par rapport a 
D1 mais est commune dans la technique et n'a aucune incidence sur les 
caracteristiques de codage proprement dites liees aux trames et aux fenetres. La 
juxtaposition est done consideree comme non inventive. 

6. N'importe quel processeur de signal serait capable d'exeeuter le precede des 
revendications 1 a 5. Vu le manque de elarte resultant de Tenonce de la 
revendication 6 (voir section VIII), cette revendication n'est done pas nouvelle. 

7. L'etat de la technique le plus proche pour la revendication 7 est considere comme 
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etant le document D3 = "A weighted overlap-add method for short-time Fourier 
analysis synthesis", R.E. Crochiere, IEEE TRans. on ASSP, Vol ASSP 28, fevrier 
1980, pages 99-102, nouvellement cite. 

D3 divulgue un precede d'analyse synthese par transformation de Fourier a court- 
terme (TFCT) et contient a ce titre toutes les caracteristiques du preambule de la 
revendication 7. 

Selon le schema de la figure 2, D3 applique aux sequences a court-terme 
resynthetisees une fenetre de synthese f(n) et additionne les portions de signal 
-obtenues par addition-et recouvrement.-D3, en ce sens,-est le plus general 
possible, puisqu'il ne donne aucune condition sur les fenetre d'analyse et de 
synthese. II est bien connu cependant qu*un choix appropri§ de fenetres d'analyse 
et de synthese permet d'obtenir, par exemple, un signal synthetise identique a 
Toriginal (voir D3, page 100, colonne de droite, paragraphe entre les equations (8) 



En supposant la partie caracterisante de la revendication 7 clarifiee (voir section 
VIII), cette partie revient a s'assurer que les portions de signaux ponderees par 
application d'une fenetre d'analyse multiplicative, recouvrent a la synthese leur 
amplitude de depart par division de la fenetre d'analyse fA, et que les signaux a 
court-termes ainsi obtenus soient ponderes sur I'espace de leur recouvrement par 
la fenetre de synthese fs de maniere a ce que la somme des facteurs de 
ponderation lors de I'addition des signaux par recouvrement soit egale a une 
constante, identique aux portions ne representant pas de recouvrement. De telles 
mesures decoulent de maniere evidente d'un document comme D3 et ne sont que 
la formalisation des conditions a realiser sur la forme des fenetres, voir le dessin 
parfaitement connu de Thomme du metier present par exemple dans US-A-5 91 1 
1 30, figure 7 et colonne 8, lignes 24-38. 

On remarquera que dans la technique, le role de la fenetre de synthese est 
souvent occulte. Ainsi, dans le schema classique d'analyse/synthese par TFCT ou 
les fenetres d'analyses triangulaires ou de Manning se recouvrent de moitie de 
maniere a avoir une somme constante egale a Tunite, les signaux resynthetises 
sont additionnes par recouvrement identique, sans application de fenetre de 



et (9)). 
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synthese, II est cependant evident que cette derniere operation conduit au meme 
resultat qu'une division par la fenetre d'analyse (pour retrouver ramplitude 1 sur la 
trame), suivie de rapplication de fenetre de synthese egale a la fenetre d'analyse 
de depart (pour ponderer de maniere adequate sur le recouvrements), connme il 
est nnentionne a la revendication 7. II n'y a done rien de nouveau la-dedans, si ce 
n'est un formalisme rigoureux pour appuyer une pratique parfaitement commune. 

8. Les caracteristiques additionnelles des revendications 8 et 9 ne sont que des 
exemples de fenetres connues dans la technique, qui en soi n'ont rien d'inventif. 

9. -L'etat de-la technique le plus pertinent pour la revendication 10 est considere 

comme 6tant D1. 

Conformement a I'analyse du point 2 ci-dessus, les caracteristiques de la 
revendication 10 jusqu'a page 33, ligne 1 , sont rendues evidentes par une 
combinaison de D1 et D2. 

Les caracteristiques additionnelles de la page 33, lignes 2-8 ne font que 
reprendre sous une forme differente (decalage M/p plutot que L) les conditions 
sur les fenetres d'analyse et de synthese de la revendication 7. Pour les raisons 
invoquees au point 7 ci-dessus, I'examinateur considere ces caracteristiques 
additionnelles comme evidentes pour un homme du metier, de sorte que, meme 
combinees au reste de la revendication 10, aucune activity inventive n'est 
reconnue. 

10. L'opinion negative pour les revendications 8 et 9 s'applique egalement aux 
revendications 11 et 12. 

1 1 . L'opinion positive pour les revendications 2 et 3 s'applique egalement aux 
revendications 13 et 14. 

12. Meme si D1 et D2 ne concement que des coefficients spectraux, I'extension a des 
coefficients cepstraux comme revendique a la revendication 15, connus en soi, ne 
semble avoir aucune incidence sur les principes de codage. Done Tobjet de la 
revendication 15 manque de satisfaire au critere d'activite inventive pour la meme 
raison que la revendication 1 0. 
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13. La revendication 16 manque de nouveaute pour la meme raison que la 
revendication 6 (voir aussi section VIII, points 1 et 2). 

14. Toutes les revendications sont susceptibles d'actlvite industrielle. 

CONCERNANT LA SECTION VII 

1. Contrairement a ce qu'exige la regie 5.1 a) il) POT, la description n'Indlque pas 
Jletatjde lajechnique anterieure pertinent expose dans les documents D1, D2 et 
D3 et ne cite pas ces documents. 

CONCERNANT LA SECTION VIII 

1. La revendication 6 mentionne un dispositif comprenant des "moyens pour 
executer" un precede. Un telle tournure manque de clarte car elle doit etre 
interpretee comme incluant des moyens simplement appropries pour executer un 
tel precede. En d'autres termes, les moyens revendiques ne sont pas limites a 
ceux qui, effectivement, ont ete programmes pour executer le precede. 

Af in de lever I'objection precedente, il conviendrait par exemple de remplacer 
Texpression "pour executer" par "programmes pour ex§cuter". 

2. Une objection equivalente est form^e centre la revendication 1 6. 

3. La clause de la revendication 7 selon iaquelle "on modifie chaque trame evaluee 
en lui appliquant un traitement correspondant a une division..." manque de clarte 
puisqu'en effet on se salt pas si le traitement revendique consiste reellement a 
effectuer une division suivi d*une multiplication, comme mentionne a la 
revendication 7, ou bien si le traitement, autre, conduit a un resultat identique. 
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Un exemple illustre cette ambiguite: le procede de synthese par TFCT tel que 
decrit dans D3 peut s'appliquer a des fenetres d'analyses et de synthese 
rectangulaires d'amplitude egale a 1 de longueur N, decalees de N. L'analyse- 
synthese consiste a mettre bout a bout les portions de signaux transformes, puis 
retransformes a Tidentique. Dans ce cas, on n'a besoin d'appliquer aucun 
traitement aux trames evaluees, mais cette absence de traitennent correspond a 
une division par la fenetre d'analyse et a la multiplication par la fenetre de 
synthese, puisque ces operations sont egales a Tidentite. 
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PROCEDES ET DISPOSITIFS ANALYSE ET DE SYNTHESE AUDIO 

La presente invention concerne I'analyse et la synthase des signaux 
audio, a partir de representations de ces signaux dans domaine spectral. 

Elle s' applique en particulier, mais non exclusivement, au codage de la 
5 parole, en bande etroite ou en bande elargie, dans diverses gammas de debit 
de codage. Parmi les autres domaines d' application, on peut citer ie debruitage 
par soustraction spectrale (voir EP-A-0 534 837 ou W099/14739). 

Dans les precedes d' analyse en question, Ie spectre du signal est 
obtenu en transformant des trames successives vers Ie domaine frequentiel. La 

10 transformation employee est Ie plus souvent la transformee de Fourier rapide 
(TFR) ; mais d' autres transformees connues sont utilisables. Dans Ie cas 
frequent d'un echantillonnage du signal a 8 kHz, Ie nombre N echantillons par 
trames est typiquement de Tordre de 100 a 500, ce qui represente des trames 
de quelques dizaines de millisecondes. Pour beneficier de la resolution 

15 maximale en frequence, la TFR est effectuee sur 2N points, N echantilions a 
zero etant ajoutes aux N echantilions de la trame. 

Le spectre obtenu par transformee de Fourier de la trame de signal est 
la convolution du spectre reel du signal par la transformee de Fourier de la 
fenetre rf analyse du signal. Cette fenetre d' analyse, qui pondere les 

20 echantilions de cheque trame, est necessaire a la prise en compte de la duree 
finie de la trame. Si la trame de signal est directement soumise a la TFR, c'est- 
a-dire si on utilise une fenetre tf analyse rectangulaire, le spectre obtenu est 
perturbe par les pics secondaires de la TFR de la fenetre tfanalyse. Pour 
limiter cet inconvenient, qui est particulierement sensible lorsque des 

25 parametres representant le signal ou le bruit doivent etre extraits des spectres, 
on a recours a des fenetres ayant de meilleures proprietes spectrales, c'est-a- 
dire des fonctions de ponderation dont le support est limite a N echantilions et 
dont la transformee de Fourier a son energie concentree dans un pic etroit 
avec une forte attenuation des pics secondaires. Les plus courantes de ces 

30 fenetres sont les fenetres de Hamming, de Hanning et de Kaiser. 

Dans la methode d' analyse et de synthese dite OLA (« Overlap-And- 
Add »), les trames successives presentent des recouvrements mutuels de 
50 % (N/2 echantilions). Comma les fenetres d'analyse couramment utillsees 
verifient la propriete fA(i+N/2) + f;^(i) = 1 , la synthese peut etre effectuee 

35 simplement en effectuant la somme a recouvrement des trames de N 
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echantillons successivement calculees par transformee de Fourier inverse des 

spectres. 

Dans le but d'affiner la representation spectrale, certaines methodes 
dites WOLA (« Weighted OLA ») utilisent a Tanalyse des trames dont les 
5 recouvrements mutuels sont de plus de 50 %. A la synthese, il est necessaire 
de reponderer les echantillons des trames avant de les sommer. Ces methodes 
augmentent la complexite de Tanalyse et de la synthese. Dans des applications 
de codage, elles augmentent egalement le debit de transmission requis. 

Un but de {'invention est de proposer un schema d'analyse et synthese 

10 de signaux audio qui permette de limiter la cadence des trames d'analyse, tout 
en utilisant des fenetres d'analyse ayant de bonnes proprietes spectrales. 

L'invention propose un precede d'analyse d*un signal audio traite par 
trames successives de N echantillons, dans lequei on pondere les echantillons 
de chaque trame par une fenetre d'analyse de type Hamming, Manning, Kaiser 

15 ou analogue, on calcule un spectre du signal audio en transformant chaque 
trame d'echantillons ponderes dans le domaine frequentiel, et on traite le 
spectre du signal audio pour delivrer des parametres de synthese d*un signal 
derive du signal audio analyse. Suivant invention, les trames successives 
comportent une alternance de trames pour lesquelles on delivre des jeux 

20 complets de parametres de synthese, qui presentent des recouvrements 
mutuels de moins de N/2 echantillons, soit moins de 50 %, et de trames pour 
lesquelles on delivre des jeux incomplets de parametres de synthese. 

Les trames pour lesquelles ne sont pas delivres des jeux complets de 
parametres de synthese peuvent ne faire Tobjet d'aucune analyse spectrale. 

25 En variante, une analyse peut neanmoins etre effectuee pour ces trames, afin 
de delivrer des jeux incomplets de parametres de synthese incluant des 
donnees representant une erreur d'interpolation d'au moins un des parametres 
de synthese et/ou des donnees representant un filtre dMnterpolation d'au moins 
un des parametres de synthese. 

30 Dans un premier domaine d'application du precede, le traltement du 

spectre du signal audio comporte une extraction de parametres de codage en 
vue de la transmission et/ou du stockage du signal audio code. Dans un 
second domaine d'application du precede, le traitement du spectre du signal 
audio comporte un debruitage par soustraction spectrale. D'autres domaines 

35 d'application peuvent encore etre envisages parmi les traitements audio. 

Un second aspect de {'invention se rapporte a un precede de synthese 
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d'un signal audio, dans lequel on obtient des estimations spectrales 
successives correspondant respectivement a des trames de N echantillons du 
signal audio ponderes par une fenetre d' analyse, les trames successives 
presentant des recouvrements mutuels de L echantillons. on evalue chaque 
5 trame du signal audio en transfomiant les estimations spectrales dans le 
domaine temporel. et on combine les trames evaluees pour former le signal 
synthetise, Selon ce precede, on modifie chaque trame evaluee en lui 
appliquant un traitement correspondant a une division par ladite fenetre 
d' analyse et a une multiplication par une fenetre de synthese, et on forme le 
10 signal synthetise comme une somme a recouvrement des trames modifiees. Le 
nombre L etant plus petit que N/2 et les echantillons tf une trame ayant des 
rangs i numerotes de 0 a N-1, la fenetre de synthese f^ii) verifie 

fgCN-L+i) + f5(i) = A pour 0 < i < L, et est egale a A pour L < i < N-L, A etant 

une constante positive. 

15 Dans une variante du precede de synthese selon 1' invention, on evalue 

un ensemble de trames recouvrantes successives de N echantillons du signal 
audio ponderes par une fenetre tf analyse, en transformant dans le domaine 
temporel des estimations spectrales correspondant respectivement auxdites 
trames. et on combine les trames evaluees pour former le signal synthetise. 

20 Pour un sous-ensemble des trames evaluees. les estimations spectrales sont 
obtenues en traitant des parametres de synthese respectivement associes aux 
trames dudit sous-ensemble tandis que, pour les trames ne faisant pas partie 
du sous-ensemble, les estimations spectrales sont obtenues avec une 
interpolation d'une partie au moins des parametres de synthese. Les trames 

25 successives dudit sous-ensemble presentent des decalages temporels mutuels 
de M echantillons, le nombre M etant plus grand que N/2, tandis que les trames 
successives dudit ensemble presentent des decalages temporels mutuels de 
M/p echantillons, p etant un entier plus grand que 1. On modifie chaque trame 
evaluee en lui appliquant un traitement correspondant a une division par ladite 

30 fenetre tf analyse et a une multiplication par une fenetre de synthese, et on 
forme le signal synthetise comme une somme a recouvrement des trames 
modifiees. Les echantillons d'une trame ayant des rangs i numerotes de 0 a 

N-1. la fenetre de synthese fs(i) a un support limite aux rangs i allant de 
N/2 - M/p a N/2 + M/p et verifie fs (i) + fs (i + M/p) = A pour N/2 - M/p < i < N/2, 
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A etant une constante positive. 

U invention propose egalement des dispositifs de traitement audio 
comprenant des moyens pour la mise en ceuvre des precedes tf analyse et de 

synthese ci-dessus. 

5 D'autres particularites et avantages de la presente invention 

apparaitront dans la description ci-apres d'exemples de realisation non 
limitatifs, en reference aux dessins annexes, dans lesquels : 

- la figure 1 est un schema synoptique d'un codeur audio selon Tinvention ; 

- les figures 2 et 3 sont des diagrammes illustrant la formation des trames 
10 de signal audio dans le codeur de la figure 1 ; 

- les figures 4 et 5 sont des graphiques montrant un exemple de spectre 
du signal audio et illustrant Textraction des enveloppes superieure et 
inferieure de ce spectre ; 

- la figure 6 est un schema synoptique d'un exemple de moyens de 
15 quantification utiiisables dans le codeur de la figure 1 ; 

- la figure 7 est un schema synoptique de moyens utiiisables pour extraire 
des parametres se rapportant a la phase de la composante non- 
harmonique dans une variante du codeur de la figure 1 ; 

- la figure 8 est un schema synoptique tf un decodeur audio correspondent 
20 au codeur de la figure 1 ; 

- la figure 9 est un organigramme d'un exemple de procedure de lissage 
de coefficients spectraux et d' extraction de phases minimales mise en 
oeuvre dans le decodeur de la figure 8 ; 

- la figure 10 est un schema synoptique de modules rfanalyse et de 
25 mixage spectral de composantes harmonique et non-harmonique du 

signal audio ; 

. les figures 11 a 13 sont des graphiques montrant des exemples de 
fonctions non-lineaires utiiisables dans le module d' analyse de la figure 
10; 

30 - les figures 14 et 15 sont des diagrammes illustrant une fa9on de proceder 

a la synthese temporelle des trames de signal dans le decodeur de la 
figure 8 ; 

- les figures 16 et 17 sont des graphiques montrant des fonctions de 
fenetrage utiiisables dans la synthese des trames suivant les figures 14 

35 et15; 
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- ies figures 18 et 19 sont des schemas synoptiques de moyens 
d' interpolation utilisables dans une variante de realisation du codeur et du 
decodeur ; 

- la figure 20 est un schema synoptique de moyens d' interpolation 
utilisables dans une autre variante de realisation du codeur ; et 

- Ies figures 21 et 22 sont des diagrammes illustrant une autre fa?on de 
proceder a la synthese temporelle des trames de signal dans le decodeur 
de la figure 8, a I'aide d'une interpolation de parametres. 

Le codeur et le decodeur decrits ci-apres sont des circuits numeriques 
qui peuvent, comme it est usuel dans le domaine du traitement des signaux 
audio, etre realises par programmation d'un processeur de signal numerique 
(DSP) ou tf un circuit integre d' application specifique (ASIC). 

Le codeur audio represents sur la figure 1 traite un signal audio 
d' entree x qui, dans Texemple non-limitatif considere ci-apres, est un signal de 
parole. Le signal x est disponible sous forme numerique, par exemple a une 
frequence d'echantillonnage Fg de 8 kHz. II est par exemple delivre par un 

convertisseur analogique-numerique traitant le signal de sortie amplifie d'un 
microphone, Le signal d'entree x peut egalement etre forme a partir rfune autre 
version, analogique ou numerique, codee ou non, du signal de parole. 

Le codeur comprend un module 1 qui forme des trames successives 
de signal audio pour Ies differents traitements effectues. et un multiplexeur de 
sortie 6 qui delivre un flux de sortie O contenant pour chaque trame des jeux 
de parametres de quantification a partir desquels un decodeur sera capable de 
synthetiser une version decodee du signal audio. 

La structure des trames est illustree par Ies figures 2 et 3. Chaque 
trame 2 est composee d'un nombre N d'echantillons consecutifs du signal 
audio x. Les trames successives presentent des decalages temporels mutuels 
correspondant a M echantillons, de sorte que leur recouvrement est de 
L = N-M echantillons du signal. Dans Texempie considere, ou N = 256. 
M = 160 et L = 96, la duree des trames 2 est de N/F^ = 32 ms, et une trame est 
formee toutes les M/F^ = 20 ms. 

De fa^on classique, le module 1 multiplie les echantillons de chaque 
trame 2 par une fonction de fenetrage f^, de preference choisie pour ses 

bonnes proprietes spectrales. Les echantillons x(i) de la trame etant numerotes 
de i = 0 a i = N-1, la fenetre d' analyse f^(i) peut ainsi etre une fenetre de 
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Hamming, d' expression : 

= 0,54 + 0.46. cosf27t '"^^~''^^^ l (1) 



ou une fenetre de Manning d' expression : 

(2) 



f r^ If-. To i-(N-1)/2^^ 

^aO) - -\ 1 + cos 2% 



21, I, N 
ou encore une fenetre de Kaiser, d' expression : 



m = - 



aJl- 



(3) 



lo(a) 

ou a est un coefficient par exemple egal a 6, et lo(.) designe la fonction de 
Bessel d'indice 0. 

Le codeur de la figure 1 precede a une analyse du signal audio dans le 
10 domaine spectral. II comporte un module 3 qui calcule la transformee de 
Fourier rapide (TFR) de cheque trame de signal. La trame de signal est mise 
en forme avant d'etre soumise au module de TFR 3 : le module 1 lui adjoint 
N = 256 echantillons a zero afin d'obtenir la resolution maximale de la 
transformee de Fourier, et il effectue d' autre part une permutation circulaire des 
15 2N = 512 echantillons afin de compenser les effets de phase resultant de la 
fenetre danalyse. Cette modification de la trame est illustree par la figure 3. La 
trame dent on calcule la transformee de Fourier rapide sur 2N = 512 points 
commence par les N/2 = 128 derniers echantillons ponderes de la trame, suivis 
par les N = 256 echantillons a zero, et se termine par les N/2 = 128 premiers 
20 echantillons ponderes de la trame. 

Le module de TFR 3 obtient le spectre du signal pour cheque trame, 
dont le module et la phase sont respectivement notes |X| et cpx* ®* 

<Px(i) pour les index de frequence i = 0 a i = 2N-1 (grace a la symetrie de la 

transformee de Fourier et des trames, on peut se limiter aux valeurs pour 
25 0 £ i < N). 

Un detecteur de frequence fondamentale 4 estime pour cheque trame 
de signal une valeur de la frequence fondamentale Fq. Le detecteur 4 peut 

appliquer toute methode connue d'analyse du signal de parole de la trame pour 
estlmer la frequence fondamentale Fq, par exemple une methode basee sur la 
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fonction d' autocorrelation ou la fonction AMDF. eventuellement precedes d'un 
module de blanchiment par prediction lineaire. Uestimation peut egalement 
etre effectuee dans le domaine spectral ou dans le domaine cepstral. Une 
autre possibilite est d'evaluer les intervalles de temps entre les ruptures 
5 consecutives du signal de parole attribuables a des fermetures de la glotte du 
locuteur intervenant pendant la duree de la trame. Des methodes bien connues 
utilisabies pour detecter de telles micro-ruptures sont decrites dans les articles 
suivants : M. Basseville et al., « Sequential detection of abrupt changes in 
spectral characteristics of digital signals » (IEEE Trans, on Information Theory. 

10 1983, Vol. IT-29. n^ 5. pages 708-723) ; R. Andre-Obrecht. « A new statistical 
approach for the automatic segmentation of continuous speech signals » (IEEE 
Trans, on Acous., Speech and Sig. Proc. Vol.36. N*"!, janvier 1988); et 
C, MURGIA et aL, « An algorithm for the estimation of glottal closure instants 
using the sequential detection of abrupt changes in speech signals » (Signal 

15 Processing VII. 1994, pages 1685-1688). 

La frequence fondamentale estimee Fq fait Tobjet d'une quantification, 

par example scaiaire, par un module 5, qui fournit au multiplexeur de sortie 6 
un index iF de quantification de la frequence fondamentale pour chaque trame 
du signal. 

20 Le codeur utilise des modelisations paramethques cepstrales pour 

representer une enveloppe superieure et une enveloppe inferieure du spectre 
du signal audio. La premiere etape de la transformation cepstrale consiste a 
appliquer au module du spectre du signal une fonction de compression 
spectrale, qui peut etre une fonction logarithmique ou en racine. Le module 8 

25 du codeur opere ainsi, pour chaque valeur X(i) du spectre du signal (0 < i < N), 
la transformation suivante : 



30 dans le cas d'une compression en racine, y etant un exposant compris entre 0 
et 1. 

Le spectre comprime LX du signal audio est traite par un module 9 qui 
extrait des amplitudes spectrales associees aux harmoniques du signal 
correspondant aux multiples de la frequence fondamentale estimee FO. Ces 



LX(i) = Log(|X(i)|) 



(4) 



dans le cas d'une compression logarithmique ou 



LX(i) = |X(i)|^ 



(5) 
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amplitudes sont ensuite interpolees par un module 10 afin d'obtenir une 
enveloppe superieure comprimee notee LX_sup. 

II est a noter que la compression spectrale pourrait de fagon 
equivalente etre effectuee apres la determination des amplitudes associees 
aux harmoniques. Elle pourrait egalement etre effectuee apres I'interpolation, 
ce qui ne ferait que modifier la forme des fonctions tf interpolation. 

Le module 9 tf extraction des maxima tient compte de Teventueile 
variation de la frequence fondamentale sur la trame d' analyse, des erreurs que 
peut commettre le detecteur 4, ainsi que des imprecisions liees au caractere 
discret de Techantillonnage en frequence. Pour cela, la recherche des 
amplitudes des pics spectraux ne consiste pas simplement a prendre les 
valeurs LX(i) correspondant aux index i tels que i.Fg/2N soit la frequence la 

plus proche d'une harmonique de frequence k.pQ (k > 1). L' amplitude spectrale 

retenue pour une harmonique d'ordre k est un maximum local du module du 
spectre au voisinage de la frequence k^pQ (cette amplitude est obtenue 

directement sous forme comprimee lorsque la compression spectrale 8 est 
effectuee avant r extraction des maxima 9). 

Les figures 4 et 5 montrent un exemple de forme du spectre comprime 
LX, ou on voit que les amplitudes maximales des pics harmoniques ne 
coincident pas necessairement avec les amplitudes correspondant aux 
multiples entiers de la frequence fondamentale estimee Fq. Les flancs des pics 

etant assez raides, une petite erreur de positionnement de la frequence 
fondamentale Fg. amplifiee par I'indice tf harmonique k, peut distordre 
fortement Tenveloppe superieure estimee du spectre et provoquer une 
mauvaise modelisation de la structure formantique du signal. Par exemple, 
prendre directement T amplitude spectrale pour la frequence 3,Fq dans le cas 

des figures 4 et 5 produirait une erreur importante dans {'extraction de 
I'enveloppe superieure au voisinage de Tharmonique tf ordre k = 3, alors qu'il 
s'agit d'une zone energetiquement importante dans r exemple desslne. En 
effectuant r interpolation a partir du veritable maximum, on evite ce genre 
tf erreur tf estimation de I'enveloppe superieure. 

Dans r exemple represents sur la figure 4, T interpolation est effectuee 
entre des points dont Tabscisse est la frequence correspondant au maximum 
de Tamplitude d'un pic spectral, et dont I'ordonnee est ce maximum, avant ou 
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apres compression. 

L interpolation effectuee pour calculer Tenveloppe superieure LX_sup 
est une simple interpolation lineaire. Bien entendu une autre forme 
d' interpolation pourrait etre utilisee (par exemple polynomial ou spline). 

5 Dans la variante preferee representee sur la figure 5, T interpolation est 

effectuee entre des points dont Tabscisse est une frequence R-Fq multiple de la 
frequence fondamentale (en fait la frequence la plus proche dans le spectre 
discret) et dont I'ordonnee est Tamplitude maximale, avant ou apres 
compression, du spectre au voisinage de cette frequence multiple, 

10 En comparant les figures 4 et 5, on peut voir que le mode tf extraction 

selon la figure 5, qui repositionne les pics sur les frequences harmoniques, 
conduit a une meilleure precision sur I'amplitude des pics que le decodeur 
attribuera aux frequences multiples de la frequence fondamentale. II peut se 
produire un leger deplacement en frequence de la position de ces pics, ce qui 

15 n'est pas perceptuellement tres important et n'est d'ailleurs pas evite non plus 
dans le cas de la figure 4. Dans le cas de la figure 4, les points tf ancrage pour 
r interpolation sent confondus avec les sommets des pics harmoniques, Dans le 
cas de la figure 5, on impose que ces points d'ancrage se trouvent precisement 
aux frequences multiples de la frequence fondamentale, leurs amplitudes 

20 correspondent a celles des pics, 

U intervene de recherche du maximum d' amplitude associe a une 
harmonique de rang k est centre sur r index i de la frequence de la TFR la plus 



proche de k-Fg. c'est-a-dire i = 



2Nk^^l 



, ou [aj designe rentier egal ou 



immediatement inferieur au nombre a. La largeur de cet intervalle de recherche 
25 depend de la frequence d'echantillonnage Fg, de la taille 2N de la TFR et de la 

gamme de variation possible de la frequence fondamentale. Cette largeur est 
typiquement de Tordre d'une dizaine de frequences avec les exemples de 
valeurs precedemment consideres. On peut la rendre reglable en fonction de la 
valeur Fq de la frequence fondamentale et du numero k de Tharmonique. 

30 Afin d'ameliorer la resolution dans les basses frequences et done de 

representer plus fidelement les amplitudes des harmoniques dans cette zone, 
une distorsion non-lineaire de Techelle des frequences est operee sur 
renveloppe superieure comprimee par un module 12 avant que le module 13 
effectue la transformee de Fourier rapide inverse (TFRI) fournissant les 
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coefficients cepstraux cx_sup. 

La distorsion non-iineaire permet de minimiser plus efficacement 
rerreur de modelisation, Elle est par exemple effectuee selon une echelle de 
frequences de type Mel ou Bark. Cette distorsion peut eventuellement 
5 dependre de la frequence fondamentale estimee Fg. La figure 1 illustre le cas 
de r echelle Mel. La relation entre les frequences F du spectre lineaire, 
exprimees en hertz, et les frequences F' de Techelle Mel est la suivante : 

IT. 1000 , f, F ^ 
logio(2) 1000 J 

Afin de limiter le debit de transmission, une troncature des coefficients 
10 cepstraux cx_sup est effectuee. Le module de TFRI 13 a besoin de calculer 
seulement un vecteur cepstral de NCS coefficients cepstraux d'ordres 0 a 
NCS-1. A titre tfexemple, NCS peut etre egal a 16. 

Un post-filtrage dans le domaine cepstral, appele post-liftrage, est 
applique par un module 15 a Tenveloppe superieure comprimee LX_sup. Ce 
15 post-liftrage correspond a une manipulation des coefficients cepstraux cx_sup 
delivres par le module de TRF1 13, qui correspond approximativement a un 
post-filtrage de la partie harmonique du signal par une fonction de transfert 
ayant la forme classique : 

20 OU A(2) est la fonction de transfert d'un filtre de prediction lineaire du signal 
audio, et 73 sont des coefficients compris entre 0 et 1 , et pi est un coefficient 

de preaccentuation eventuellement nul. La relation entre le coefficient post-liftre 
d'ordre i, note Cp(l), et le coefficient cepstral correspondant c(l) = cx_sup(i) 

dellvre par le module 13 est alors : 

Cp(0) = c(0) 

Cp(i) = \} + y2-y\ jc(i) - J pour i > 0 

Le coefficient de preaccentuation optionnel n peut etre controle en 
posant comme contrainte de preserver la valeur du coefficient cepstral 
cx_sup(1) relatif a la pente. En effet, la valeur c(1) = cx_sup(1) d'un bruit blanc 
filtre par le filtre de preaccentuation correspond au coefficient de 
30 preaccentuation. On peut ainsi choisir ce dernier de la fa^on suivante : 
^i = (Y2-Yi)c(1). 
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Apres le post-liftre 15, un module de normalisation 16 modifie encore 
les coefficients cepstraux en imposant la contrainte de modelisation exacte 
d'un point du spectre initial, qui est de preference le point le plus energetique 
parmi les maxima spectraux extraits par le module 9. En pratique, cette 

5 normalisation modifie seulement la valeur du coefficient Cp(0). 

Le module de normalisation 16 fonctionne de la fafon suivante : il 
recalcule une valeur du spectre synthetise a la frequence du maximum indique 
par le module 9, par transformee de Fourier des coefficients cepstraux 
tronques et post-liftres, en tenant compte de la distorsion non-lineaire de I'axe 

10 des frequences ; 11 determine un gain de normalisation par la difference 
logarithmique entre la valeur du maximum fournie par le module 9 et cette 
valeur recalculee ; et il ajoute le gain g^j au coefficient cepstral post-liftre cp(0). 

Cette normalisation peut etre vue comme faisant partie du post-liftrage. 

Les coefficients cepstraux post-liftres et normalises font Tobjet d'une 
15 quantification par un module 18 qui transmet des index de quantification 
correspondants icxs au multiplexeur de sortie 6 du codeur. 

Le module 18 peut fonctionner par quantification vectorielle a partir de 
vecteurs cepstraux formeis de coefficients post-liftres et normalises, notes ici 
cx[n] pour la trame de signal de rang n. A titre d'exemple, le vecteur cepstral 
20 cx[n] de NCS = 16 coefficients cepstraux cx[n,0], cx[n,1], .... cx[n,NCS-1] est 
distribue en quatre sous-vecteurs cepstraux contenant chacun quatre 
coefficients d'ordres consecutifs. Le vecteur cepstral cx[n] peut etre traite par 
les moyens representes sur la figure 6, faisant partie du module de 
quantification 18. Ces moyens mettent en oeuvre. pour chaque composante 
25 cx[n,il, un predicteur de la forme : 

cxp[n.i] = (l-a(i)).rcx[n,i] + a(i).rcx[n-1,i] (9) 

ou rcx[n] designe un vecteur residuel de prediction pour la trame de rang n 
dont les composantes sont respectivement notees rcx[n,0]. rcx[n,1]. .... 
rcx[n,NCS-1], et a(i) designe un coefficient de prediction choisi pour etre 
30 representatif rfune correlation inter-trame supposee, Apres quantification des 
residus, ce vecteur residuel est defini par : 

^ 2-a(i) 
ou rcx_c|[n-13 designe le vecteur residuel quantifie pour la trame de rang n-1, 
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dont les composantes sont respectivement notees rcx_q[n,0], rcx_q[n,1] 

rcx_q[n,NCS-1]. 

Le numerateur de la relation (10) est obtenu par un soustracteur 20, 
dont les composantes du vecteur de sortie sont divisees par les quantites 
2-a(i) en 21. Aux fins de la quantification, le vecteur residuel rcx[n] est 
subdivise en quatre sous-vecteurs, correspondant a la subdivision en quatre 
sous-vecteurs cepstraux. Sur la base d'un dictionnaire obtenu par 
apprentissage prealable, I'unite 22 precede a la quantification vectorielle de 
chaque sous-vecteur du vecteur residuel rcx[n]. Cette quantification peut 
consister, pour chaque sous-vecteur srcx[n], a selectionner dans le dictionnaire 
le sous-vecteur quantlfie srcx_q[n] qui minimise I'erreur quadratique 

||srcx[n] - srcx_q[n| . L' ensemble icxs des index de quantification icx, 

correspondant aux adresses dans le ou les dictionnaires des sous-vecteurs 
residuels quantifies srcx_q[n], est foumi au multiplexeur de sortie 6. 

L' unite 22 deiivre egalement les valeurs des sous-vecteurs residuels 
quantifies, qui fomrient le vecteur rcx_q[n]. Celui-ci est retarde d'une trame en 
23, et ses composantes sont multipliees par les coefficients a(i) en 24 pour 
fournir le vecteur a 1' entree negative du soustracteur 20. Ce dernier vecteur est 
d'autre part foumi a un additionneur 25, dont 1' autre entree regoit un vecteur 
forme par les c»mposantes du residu quantlfie rcx_q[n] respectivement 
multipliees par les quantites 1-a(i) en 26. L' additionneur 25 deiivre ainsi le 
vecteur cepstral quantifie cx_q[n] que recuperera le decodeur. 

Le coefficient de prediction a(i) peut etre optimise separement pour 
chacun des coefficients cepstraux. Les dictionnaires de quantification peuvent 
aussi etre optimises separement pour chacun quatre sous-vecteurs cepstraux. 
D'autre part, ii est possible, de fa9on connue en soi, de normaliser les vecteurs 
cepstraux avant d'appliquer le schema de prediction/quantification, a partir de 
la variance des cepstres. 

II est a noter que le schema ci-dessus de quantification des coefficients 
cepstraux peut n'etre applique que pour certalnes seulement des trames. Par 
exemple, on peut prevoir un second mode de quantification ainsi qu'un 
processus de selection de celui des deux modes qui minimise un critere de 
moindres carres avec les coefficients cepstraux a quantifier, et transmettre 
avec les index de quantification de la trame un bit indiquant lequel des deux 
modes a ete selectionne. 
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Les coefficients cepstraux quantifies cx_sup_q = cx_q[n] fournis par 
Tadditionneur 25 sont adresses a un module 28 qui recalcule les amplitudes 
spectrales associees a une ou plusieurs des harmoniques de la frequence 
fondamentale Fq (figure 1). Ces amplitudes spectrales sont par exemple 

5 calculees sous forme comprimee, en appliquant la transformee de Fourier aux 
coefficients cepstraux quantifies en tenant compte de la distorsion non-lineaire 
de Techelle des frequences utilisee dans la transformation cepstrale. Les 
amplitudes ainsi recalculees sont foumies a un module d'adaptation 29 qui les 
compare a des amplitudes de maxima determinees par le module d' extraction 



Le module d'adaptation 29 controle le post-liftre 15 de fa^on a 
minimiser un ecart de module entre le spectre du signal audio et les valeurs de 
module correspondantes calculees en 28. Get ecart de module peut etre 
exprime par une somme de valeurs absolues de differences tfamplitudes. 

15 comprimees ou non, correspondent a une ou plusieurs des frequences 
harmoniques. Cette somme peut etre ponderee en fonction des amplitudes 
spectrales associees a ces frequences. 

De fapon optimale, T ecart de module pris en compte dans Tadaptation 
du post-liftrage tiendrait compte de toutes les harmoniques du spectre. 

20 Cependant, afin de reduire la complexite de roptimisation, le module 28 peut 
ne resynthetiser les amplitudes spectrales que pour une ou plusieurs 
frequences multiples de la frequence fondamentale Fq, selectionnees sur la 
base de T importance du module du spectre en valeur absolue. Le module 
d'adaptation 29 peut par exemple considerer les trois pics spectraux les plus 

25 intenses dans le calcul de Tecart de module a minimiser. 

Dans une autre realisation, le module d'adaptation 29 estime une 
courbe de masquage spectral du signal audio au moyen rfun modele 
psychoacoustique, et les frequences prises en compte dans le calcul de Tecart 
de module a minimiser sont selectionnees sur la base de rimportance du 

30 module du spectre relativement a la courbe de masquage (on peut par 
exemple prendre les trois frequences pour lesquelles le module du spectre 
depasse le plus de la courbe de masquage). Differentes methodes classiques 
sont utilisables pour calculer la courbe de masquage a partir du signal audio. 
On peut par exemple utiliser celle developpee par J.D. Johnston (« Transform 

35 Coding of Audio Signals Using Perceptual Noise Criteria ». IEEE Journal on 



10 



9. 
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Selected Area in Communications. Vol. 6, No. 2, fevrier 1 988). 

Pour realiser Tadaptation du post-iiftrage, le module 29 peut utiliser un 
modele d' identification de filtre. Une methode plus simple consiste a predefinir 
un ensemble de jeux de parametres de post-liftrage, c'est-a-dire un ensemble 
5 de couples Y1.Y2 dans le cas d'un post-liftrage selon les relations (8), a 

effectuer les operations incombant aux modules 15, 16, 18 et 28 pour chacun 
de ces jeux de parametres, et a retenir celui des jeux de parametres qui 
conduit a Tecart de module minimal antra le spectre du signal et les valeurs 
recaiculees. Les index de quantification foumis par le module 18 sont alors 

10 ceux qui se rapportent au meilleur jeu de parametres. 

Par un processus analogue a celui de Textraction des coefficients 
cx_sup representant Tenveloppe superieure comprimee LX_sup du spectre du 
signal, le codeur determine des coefficients cxjnf representant une enveloppe 
inferieure comprimee LXJnf. Un module 30 extrait du spectre comprime LX 

15 des amplitudes spectrales associees a des frequences situees dans des zones 
du spectre intermediaires par rapport aux frequences multiples de la frequence 
fondamentale estimee Fg. 

Daris Texempla illustre par les figures 4 et 5, chaque amplitude 
associee a une frequence situee dans une zone intermediaire entre deux 
20 harmoniques successives kPg et (k+1).Fo correspond simplement au module 
du spectre pour la frequence (k+1/2).FQ situee au milieu de Tintervalle separant 
les deux harmoniques. Dans une autre realisation, cette amplitude pourrait etre 
une moyenne du module du spectre sur une petite plage entourant cette 
frequence (k+1/2).Fo. 

25 Un module 31 precede a une interpolation, par exemple lineaire, des 

amplitudes spectrales associees aux frequences situees dans les zones 
intermediaires pour obtenir r enveloppe inferieure comprimee LXJnf. 

La transformation cepstrale appliquee a cette enveloppe inferieure 
comprimee LX_inf est effectuee suivant une echelle de frequences resultant 

30 d'une distorsion non-lineaire appliquee par un module 32. Le module de TFRI 
33 calcule un vecteur cepstral de NCI coefficients cepstraux cxJnf d'ordres 0 a 
NCl-1 representant Tenveloppe inferieure. NCI est un nombre qui peut etre 
sensiblement plus petit que NCS, par exemple NCI = 4. 

La transformation non-lineaire de T echelle des frequences pour la 

35 transformation cepstrale de T enveloppe inferieure peut etre realisee vers une 
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echelle plus fine aux hautes frequences qu'aux basses frequences, ce qui 
permet avantageusement de bien modeliser les composantes non-voisees du 
signal aux hautes frequences. Toutefois. pour assurer une homogeneite de 
representation entre I'enveloppe superieure et Tenveloppe inferieure, on pourra 
5 preferer adopter dans le module 32 la meme echelle que dans le module 12 
(Mel dans Texemple considere). 

Les coefficients cepstraux cxjnf representant I'enveloppe inferieure 
comprimee sont quantifies par un module 34, qui peut fonctionner de la meme 
maniere que le module 18 de quantification des coefficients cepstraux 

10 representant I'enveloppe superieure comprimee. Dans le cas considere, ou on 
se limite a NCI = 4 coefficients cepstraux pour I'enveloppe inferieure, le vecteur 
ainsi forme est soumis a une quantification vectorielle de residu de prediction, 
effectuee par des moyens identiques a ceux representes sur la figure 6 mais 
sans subdivision en sous-vecteurs. U index de quantification icx = icxi 

15 determine par le quantificateur vectoriel 22 pour chaque frame relativement aux 
coefficients cx_inf est fourni au multiplexeur de sortie 6 du codeur. 

Le codeur represente sur la figure 1 ne comporte aucun dispositif 
particulier pour coder les phases du spectre aux harmoniques du signal audio. 

En revanche, il comporte des moyens 36-40 pour coder une 

20 information temporelle liee a la phase de la composante non-harmonique 
representee par I'enveloppe inferieure. 

Un module 36 de decompression spectrale et un module 37 de TFRI 
forment une estimation temporelle de la trame de la composante non- 
harmonique. Le module 36 applique une fonction de decompression reciproque 

25 de la fonction de compression appliquee par le module 8 (c'est-a-dire une 
exponentielle ou une fonction puissance 1/y) a I'enveloppe inferieure 
comprimee LXJnf produite par le module tf interpolation 31. Ceci fournit le 
module de la trame estimee de la composante non-harmonique, dont la phase 
est prise egale a celle cp^ du spectre du signal X sur la trame. La transformee 

30 de Fourier inverse effectuee par le module 37 fournit la trame estimee de la 
composante non-harmonique. 

Le module 38 subdivise cette trame estimee de la composante non- 
harmonique en plusieurs segments temporels. La trame delivree par le module 
37 se composant de 2N = 512 echantillons ponderes comme illustre par la 

35 figure 3, le module 38 considere seulement ^es N/2 = 128 premiers echantillons 
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et les N/2 = 128 derniers echantillons, et les subdivise par example en 
huit segments de 32 echantillons consecutifs representant chacun 4 ms de 
signal. 

Pour chaque segment, le module 38 calcule I'energie egale a la 
5 somme des can"es des echantillons, et forme un vecteur El fomne de 
huit composantes reelles positives egales aux huit energies calculees. La plus 
grande de ces huit energies, notee EM, est egalement determinee pour etre 
fournie, avec le vecteur E1, a un module de normalisation 39. Celui-ci divise 
chaque composante du vecteur E1 par EM, de sorte que le vecteur normalise 
10 Emix est forme de huit composantes comprises entre 0 et 1. C'est ce vecteur 
normalise Emix, ou vecteur de ponderation, qui est soumis a la quantification 
par le module 40. Celui-ci peut operer une quantification vectorielle avec un 
dictionnaire determine lors rfun apprentissage prealable. U index de 
quantification i Em est fourni par le module 40 au multiplexeur de sortie 6 du 
15 codeur. 

La figure 7 montre une variante de realisation des moyens employes 
par le codeur de la figure 1 pour determiner le vecteur Emix de ponderation 
energetique de la trame de la composante non-harmonique. Les modules 36, 
37 de decompression spectrale et de TFRI fonctionnent comme ceux qui 

20 portent les memes references sur la figure 1 . Un module de selection 42 est 
ajoute pour determiner la valeur du module du spectre soumis a la transformee 
de Fourier inverse 37. Sur la base de la frequence fondamentale estimee Fg, le 
module 42 identifie des regions harmoniques et des regions non-harmoniques 
du spectre du signal audio. Par exemple, une frequence sera consideree 

25 comme appartenant a une region harmonique si elie se trouve dans un 
intervalle de frequences centre sur une harmonique K.Fq et de largeur 
correspondent a une largeur de raie spectrale synthetisee, et a une region non- 
harmonique sinon. Dans les regions non-harmoniques, le signal complexe 
soumis a la TFRI 37 est egal a la valeur du spectre, c'est-a-dire que son 

30 module et sa phase correspondent aux valeurs (X| et cp^ foumies par le module 

de TFR 3. Dans les regions harmoniques. ce signal complexe a la meme 
phase (px I® spectre et un module donne par Tenveloppe inferieure apres 
decompression spectrale 36. Cette fagon de proceder selon la figure 7 procure 
une modelisation plus precise des regions non-harmoniques. 
35 Le decodeur represents sur la figure 8 comprend un demultiplexeur 
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tf entree 45 qui extrait du flux binaire O, issu d'un codeur selon la figure 1. les 
index iF, icxs, icxi. lEm de quantification de la frequence fondamentale Fg, des 

coefficients cepstraux representant Tenveloppe superieure comprimee. des 
coefficients representants I'enveloppe inferieure comprimee, et du vecteur de 
ponderation Emix. et les distribue respectivement a des modules 46, 47, 48 et 
49. Ces modules 46-49 comportent des dictionnaires de quantification 
semblables a ceux des modules 5, 18, 34 et 40 de la figure 1, afin de restituer 
les valeurs des parametres quantifies. Les modules 47 et 48 ont des 
dictionnaires pour former les residus de prediction quantifies rcx_q[n], et ils en 
deduisent les vecteurs cepstraux quantifies cx_q[n] avec des elements 
identiques aux elements 23-26 de la figure 6. Ces vecteurs cepstraux 
quantifies cx_q[n] fournissent les coefficients cepstraux cx_sup_q et cxjnf_q 
traites par le decodeur. 

Un module 51 calcule la transformee de Fourier rapide des coefficients 
cepstraux cx_sup pour chaque trame de signal. Lechelle des frequences du 
spectre comprime qui en resulte est modifiee non-lineairement par un module 
52 appliquant la transformation non-lineaire reciproque de celle du module 12 
de la figure 1, et qui fournit Testimation LX_sup de I'enveloppe superieure 
comprimee. Une decompression spectraie de LX^sup, operee par un module 
53, foumit I'enveloppe superieure X_sup comportant les valeurs estimees du 
module du spectre aux frequences multiples de la frequence fondamentale Fq. 

Le module 54 synthetise {'estimation spectraie de ia composante 

harmonique du signal audio, par une somme de raies spectrales centrees sur 
les frequences multiples de la frequence fondamentale Fq et dont les 

amplitudes (en module) sont celles donnees par I'enveloppe superieure X_sup. 

Bien que le flux numerique d'entree <I) ne comporte pas d' informations 
specifiques sur la phase du spectre du signal aux harmoniques de la frequence 
fondamentale, le decodeur de ia figure 8 est capable d'extraire de r information 
sur cette phase a partir des coefficients cepstraux cx_sup_q representant 
I'enveloppe superieure comprimee. Cette information de phase est utilisee pour 
affecter une phase (p(k) a chacune des raies spectrales determinees par Je 
module 54 dans 1' estimation de la composante harmonique du signal. 

En premiere approximation, le signal de parole peut etre considere 
comme etant a phase minimale. D' autre part, il est connu que r information de 
phase minimale peut se deduire facilement d'une modelisation cepstrale. Cette 
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information de phase minimale est done calculee pour chaque frequence 
harmonique, Uhypothese de phase minimale signifie que I'energie du signal 
synthetise est localisee au debut de chaque periode de la frequence 
fondamentale Fq. 

5 Pour etre plus proche d'un signal de parole reel, on introduit un peu de 

dispersion au moyen d'un post-liftrage specifique des cepstres lors de la 
synthese de la phase. Avec ce post-liftrage, effectue par le module 55 de la 
figure 8, il est possible d'accentuer les resonances fomnantiques de Tenveloppe 
et done de controler la dispersion des phases. Ce post-liftrage est par exemple 

10 de la forme (8). 

Pour limiter les ruptures de phase, il est preferable de lisser les 
coefficients cepstraux post-liftres, ce qui est effectue par le module 56. Le 
module 57 deduit des coefficients cepstraux post-liftres et lisses la phase 
minimale affectee a chaque raie spectrale representant un pic harmonique du 

15 spectre. 

Les operations effectuees par les modules 56, 57 de lissage et 
d'extraction de la phase minimale sont illustrees par Torganigramme de la 
figure 9. Le module 56 examine les variations des coefficients cepstraux pour 
appliquer un lissage moins important en presence de variations brusques qu'en 
20 presence de variations lentes. Pour cela, il effectue le lissage des coefficients 
cepstraux au moyen d'un facteur rfoubli choisi en fonction rfune 

comparaison entre un seuil d^^ et une distance d entre deux jeux successifs de 

coefficients cepstraux post-liftres. Le seuil d^j, est lui-meme adapte en fonction 

des variations des coefficients cepstraux. 

25 La premiere etape 60 consiste a calculer la distance d entre les deux 

vecteurs successifs relatifs aux trames n-1 et n. Ces vecteurs, notes ici 
cxp[n-1] et cxp[n], correspondent pour chaque trame a r ensemble des NCS 
coefficients cepstraux post-liftres representant Tenveloppe superieure 
comprimee. La distance utilisee peut notamment etre la distance euclidienne 

30 entre les deux vecteurs ou encore une distance quadratique. 

Deux lissages sont rfabord effectues, respectivement au moyen de 
facteurs tf oubli X^^^ et pour determiner une distance minimale d^^j^, et 

une distance maximale d^^^^. Le seuil d^^, est ensuite determine a Tetape 70 

comme etant situe entre les distances minimale et maximale d-^jn. d^oy • 
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= 3 d^^ax {''-P)^min' '® coefficient |3 etant par exemple egal a 0,5. 

Dans r exemple represente, les facteurs d'oubli Xp^j^ et X^^^^ sont eux- 
memes selectionnes parmi deux valeurs distinctes, respectivement X^jni , >7nin2 
®t ^maxi' ^fnax2 comprises entre 0 et 1, les indices Xf^^^' ^maxi chacun 
5 sensiblement plus pres de 0 que les Indices >.n,jp2. ^max2- Si d > d^,p (test 61), 
le facteur d'oubli X^j^ est egal a X^jpi (etape 62) ; sinon il est pris egal a X^^2 
(etape 63). A I' etape 64, la distance minimale dp^j^ est prise egale a 
+ (l-^^in) ^- Si d > d„,3^ (test 65), le facteur d'dubli est egal a 
Xn,axi (etape 66) ; sinon il est pris egal a >tmax2 (etape 67). A I'etape 68, la 
10 distance minimale dfj^^x ®®* prise egale a J^max-^max ■*" C'^max)-^- 

Si la distance d entre les deux vecteurs cepstraux consecutifs est plus 
grande que le seuil <i^^^ (test 71), on adopte pour le facteur d'oubli X^. une valeur 

X^^ relativement proche de 0 (etape 72). On considere dans ce cas que le 

signal correspondant est de type non stationnaire, de sorte qu'il n'y a pas lieu 
15 de conserver une grande memoire des coefficients cepstraux anterieurs. Si 
d < d^f,, on adopte a I'etape 73 pour le facteur d'oubli X^ une valeur X^2 "^o'rts 

proche de 0 afin de lisser davantage les coefficients cepstraux. Le lissage est 
effectue a I'etape 74, ou le vecteur cxl[n] de coefficients lisses pour la trame 
courante n est determine par : 
20 cxl[n] = X.c.cxl[n-1] + (1 - Xc )cxp[nl (11) 

Le module 57 calcule ensuite ies phases minimales p(k) associees aux 
harmoniques K.Fq. De fagon connue, la phase minimale pour une harmonique 
d'ordre k est donnee par : 

NCS-1 

(p(k) = -2. 2] cxl[n,m].sin(2jimkFo/Fe) C^) 
m=l 

25 ou cxl[n,m] designe le coefficient cepstral lisse d'ordre m pour la trame n. 

A I'etape 75, 1* index d' harmonique k est initialise a 1 . Pour initialiser le 
calcul de la phase minimale affectee a I'harmonique k, la phase q>(k) et I'index 
cepstral m sont initialises respectivement § 0 et 1 a I'etape 76. A I'etape 77. le 
module 57 ajoute d la phase <p(k) la quantite -2.cxl(n,m].sin(2icmk.Fo/Fg). 

30 L'index cepstral m est incremente a I'etape 78 et compare a NCS a I'etape 79. 
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Les etapes 77 et 78 sont repetees tant que m < NCS. Quand m = NCS, le 
calcul de la phase minimale est termine pour rhaimonique k, et I'index k est 
incremente a I'etape 80. Le calcul de phases minimales 76-79 est renouvele 
pour rharmonique suivante tant que kpQ < (test 81). 

5 Dans I'exempie de realisation selon la figure 8, ie module 54 tient 

compte d'une phase constante sur la largeur de chaque raie spectraie, egale a 
la phase minimale (p(k) foumie pour I'harmonique correspondante k par le 
module 57. 

L' estimation de la composante harmonique est synthetisee par 

10 sommation de raies spectrales positionnees aux frequences harmoniques de la 
frequence fondamentale Fq. Lors de cette synthese, on peut positionner les 

raies spectrales sur I'axe des frequences avec une resolution superieure a la 
resolution de la transformee de Fourier. Pour cela, on precaicule une fois pour 
toutes une raie spectraie de reference selon la resolution superieure. Ce calcul 

15 peut consister en une transformee de Fourier de la fenetre d' analyse fA avec 

une taille de transformee de 16384 points, procurant une resolution de 0,5 Hz 
par point. La synthese de chaque raie harmonique est aiors effectuee par le 
module 54 en positionnant sur I'axe des frequences la raie de reference a 
haute resolution, et en sous-echantillonnant cette raie spectraie de reference 

20 pour se ramener a la resolution de 16,625 Hz de la transformee de Fourier sur 
512 points. Ceci permet de positionner avec precision la raie spectraie. 

Pour la determination de I'enveloppe inferieure, le module de TFR 85 
du decodeur de la figure 8 revolt les NCI coefficients cepstraux quantifies 
cx_inf_q d'ordres 0 a NCI-1, et il les complete avantageusement par les 

25 NCS -NCI coefficients cepstraux cx_sup_q d'ordre NCI a NCS-1 
representant I'enveloppe superieure. En effet, on peut estimer en premiere 
approximation que les variations rapides de I'enveloppe inferieure comprimee 
sont bien reproduites par celles de I'enveloppe superieure comprimee. Dans 
une autre realisation, le module de TFR 85 pourrait ne considerer que les NCI 

30 parametres cepstraux cxjnf_q. 

Le module 86 convertit I'echelle de frequences de maniere reciproque 
de la conversion operee par le module 32 du codeur, afin de restituer 
I'estimatlon LXJnf de I'enveloppe inferieure comprimee, soumise au module de 
decompression spectraie 87. En sortie du module 87, le decodeur dispose 
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d'une enveloppe inferieure X_inf comportant ies valeurs du module du spectre 
dans Ies vallees situees entre Ies pics harmoniques. 

Cette enveloppe XJnf va moduler le spectre tf une trame de bruit dont 
la phase est traitee en fonction du vecteur de ponderation quantifie Emix extrait 
5 par le module 49. Un generateur 88 deiivre une trame de bruit normalise dont 
ies segments de 4 ms sent ponderes dans un module 89 conformement aux 
composantes normalisees du vecteur Emix fourni par le module 49 pour la 
trame courante. Ce bruit est un bruit blanc filtre passe-haut pour tenir compte 
du faible niveau qu'a en principe la composante non-voisee aux basses 
10 frequences. A partir du bruit pondere en energie, le module 90 forme des 
trames de 2N,= 512 echantillons en appliquant la fenetre d' analyse f^^, 

r insertion de 256 echantillons a zero et la permutation circulaire pour la 
compensation de phase conformement a ce qui a ete explique en reference a 
la figure 3. La transformee de Fourier de la trame resultante est calculee par le 
15 module TFR 91. 

^estimation spectrale X^^ de la composante non-harmonique est 

determinee par le module de synthese spectrale 92 qui effectue une 
ponderation frequence par frequence. Cette ponderation consiste a multiplier 
chaque valeur spectrale complexe fournie par le module de TFR 91 par la 
20 valeur de T enveloppe inferieure XJnf obtenue pour la meme frequence par le 
module de decompression spectrale 87. 

Les estimations spectrales X^, X^^^ des composantes harmonique 

(voisee dans le cas d'un signal de parole) et non-harmonique (ou non-voisee) 
sont combinees par un module de mixage 95 controle par un module 96 
25 tf analyse du degre d'harmonicite (ou de voisement) du signal. 

L'organisation de ces modules 95, 96 est iliustree par la figure 10. Le 
module d'analyse 96 comporte une unite 97 tfestimation d'un degre de 
voisement W dependant de la frequence, a partir duquel sont calcules quatre 
gains dependant de la frequence, a savoir deux gains g^, g^^ controlant 

30 importance relative des composantes harmonique et non-harmonique dans le 
signal synthetise, et deux gains g^ g^^ ^ utilises pour bruiter la phase de la 

composante harmonique. 

Le degre de voisement W(i) est une valeur a variation continue 
comprise entre 0 et 1 determinee pour chaque index de frequence i (0 < i < N) 
35 en fonction de Tenveloppe superieure X_sup(i) et de Tenveloppe inferieure 
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X_inf(i) obtenues pour cette frequence i par les modules de decompression 53, 
87. Le degre de voisement W(i) est estime par 1' unite 97 pour chaque index de 
frequence i correspondant a une harmonique de la frequence fondamentale Fq. 



a savoir i = 



2Nk^0-hl 
•=6 2 



pour k=1,2,..., par une fonction croissante du 



5 rapport entre I'enveloppe superieure X_sup et I'enveioppe inferieure XJnf a 
cette frequence, par exemple selon la formule : 

W(i) = min 

L 10.logio[X_ sup(i)/XJnf(i)] | ^^^^ 

Le seuil Vth(Fo) correspond a la dynamlque moyenne calculee sur un spectre 
synthetique purement voise a la frequence fondamentale. II est 
10 avantageusement choisi dependant de la frequence fondamentale Fq. 

Le degre de voisement W(i) pour une frequence autre que les 
frequences harmoniques est obtenu simplement comme etant egal a celui 
estime pour r harmonique la plus proche. 

Le gain g^(i), qui depend de la frequence, est obtenu en appliquant une 

15 fonction non-lineaire au degre de voisement W(i) (bloc 98). Cette fonction non- 
lineaire a par exemple la forme representee sur la figure 1 1 : 

gy(i) = 0 siO^W(i)^W1 

wn)-wi 

gv(')= VV2_W1 S'W1<W(i)<W2 (14) 
9^0) = 1 siW2^W(i)^1 
20 les seuils W1. W2 etant tels que 0 < W1 < W2 < 1. Le gain g^^ peut etre 
calcule de maniere semblable au gain g^ (la somme des deux gains g^, g^^ 
etant constante, par exemple egale a 1 ), ou deduit simplement de celui-ci par 
la relation Q^^^{\) = 1 - g^(i), comme schematise par le soustracteur 99 sur la 
figure 10. 

25 il est interessant de pouvoir bruiter la phase de la composante 

harmonique du signal a une frequence donnee si I'analyse du degre de 
voisement montre que ie signal est plutot de type non-harmonique a cette 

frequence. Pour cela, la phase cp'^ de la composante harmonique mixee est le 

resultat d'une combinaison lineaire des phases q>y, <pyy des composantes 

30 hamionique et non-harmonique X^, Xy^ synthetisees par les modules 54, 92. 
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Les gains g^_^. Ouv^cp respectivement appliques a ces phases sont calcules a 
partir du degre de voisement W et ponderes egalement en fonction de T index 
de frequence i, etant donne que le bruitage de la phase n'est veritablement 
utile qu*au-dela d'une certaine frequence. 
5 Un premier gain g^-^ ^ est calcule en appliquant une fonction non- 

lineaire au degre de voisement W(i), comme schematise par le bloc 100 sur la 
figure 10. Cette fonction non-lineaire peut avoir la forme representee sur la 
figure 12 : 

gvl_<p(0 = G1 siO<W(i)<W3 

^0 9vl_9(')= G1 + (1-G1)^^^5^ siW3<W(i)<W4 (15) 

gvl_(p(0 = 1 siW4<W(i)<1 
les seuils W3 et W4 etant tels que 0 < W3 < W4 < 1, et le gain minimal G1 
etant compris entre 0 et 1 . 

Un multiplieur 101 multiplie pour cheque frequence d'index i le gain 
15 Ovi <p P^^ autre gain g^2 q> dependant seulement de Tindex de frequence i. 
pour former le gain g^ ^(i). Le gain cp(0 depend non-lineairement de {'index 
de frequence i, par exempie comme indique sur la figure 13 : 

9v2.<p(*) = 1 siO<i<i1 

9v2.<p(i) = 1 - (1 - G2)^ si i1 < i < 12 (16) 

20 gv2.<p(') = G2 sii2<i<1 

les index i1 et 12 etant tels que 0 < i1 < i2 < N, et le gain minimal G2 etant 
compris entre 0 et 1. Le gain g^j^ ^^(i) peut etre calcule simplement comme 
etant egal a 1 - g^^^(i) = 1 - gvi_cp(i).gv2^cp(') (soustracteur 102 de la figure 
10). 

25 Le spectre complexe Y du signal synthetise est produit par le module 

de mixage 95, qui realise la relation de mixage suivante. pour 0 ^ i < N : 

Y(i) = gv(i).|Xv(i)|- expD<p'v(i)] QuvO)- \y(}) . (17) 

avec cp^Ci) = g^_^(i). (p^(i) + g^^_^(i). (p^^<i) (15) 

ou (py(i) designe Targument du nombre complexe \(\) foumi par le module 54 
30 pour la frequence d'index i <bloc 104 de la figure 10), et (p^{\) designe 
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Targument du nombre complexe Xyy(i) fourni par le module 92 (bloc 105 de la 

figure 10). Cette combinaison est realisee par les multiplieurs 106-110 et les 
additionneurs 111-112 representes sur la figure 10. 

Le spectre mixe Y(i) pour 0 < I < 2N (avec Y(2N-1-i) =Y(i)) est ensuite 
5 transforme dans le domaine temporel par le module de TFR1 115 (figure 8). On 
ne retient que les N/2 = 128 premiers et les N/2 = 128 demiers echantillons de 
la trame de 2N = 512 echantillons produite par le module 1 15, et on applique la 
permutation circulaire inverse de celle illustree par la figure 3 pour obtenir la 
trame synthetisee de N = 256 echantillons ponderes par la fenetre d' analyse f^. 

10 Les trames successivement obtenues de cette maniere sont finalement 

traitees par le* module de synthese temporelle 116 qui forme le signal audio 
decode x . 

Le module de synthese temporelle 116 effectue una somme a 
recouvrement de trames modifiees par rapport a celles successivement 
15 evaluees en sortie du module 115. La modification peut etre vue en deux 
etapes illustrees respectivement par les figures 14 et 15. 

La premiere etape (figure 14) consiste a multiplier chaque trame 2' 
delivree par le module de TFRI 115 par une fen§tre l/f^^ inverse de la fendtre 

d'analyse employee par le module 1 du codeur. Les echantillons de la trame 

20 2" qui en resultent sont done ponderes uniformement. 

La seconde etape (figure 15) consiste a multiplier les echantillons de 
cette trame 2" par une fenetre de synthese fe verifiant les proprietes suivantes : 



25 ou A designe une constante positive arbitraire, par exemple A = 1 . La fenetre 
de synthese fs(i) croit progressivement de 0 a A pour i allant de 0 a L. C'est par 

exemple une demi-sinusoide surelevee : 



30 le module 116 positionne les trames successives avec leurs decalages 
temporels de M = 160 echantillons et leurs recouvrements temporels de L = 96 
echantillons, puis il effectue la somme des trames ainsi poslttonnees dans le 
temps. Du fait des proprietes (19) et (20) de la fen§tre de synthese fg, chaque 



fs(N-L+i) + fs(i) = A pour 0 ^ i < L 
^s^') ~ ^ P^""" L ^ i < N-L 



(20) 



(19) 




Apres avoir repondere chaque trame 2" par la fenetre de synthese f. 
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echantillon du signal audio decode x ainsi obtenu est affecte d'un poids global 
uniforme, egal a A. Ce poids global provient de la contribution d'une trame 
unique si Techantillon a dans cette trame un rang i tel que L < i < N - L, et 
comporte les contributions sommees de deux trames successives si 0 < i < L 
5 ou N - L < i < N. 

On peut ainsi effectuer la synthese temporelle de fagon simple meme 
si, comme dans ie cas considere, le recouvrement L entre deux trames 
successives est plus petit que la moitie de la taille N de ces trames. 

Les deux etapes exposees ci-dessus pour la modification des trames 
10 de signal peuvent etre fusionnees en une seule etape. II suffit de precalculer 
une fenetre composee fQ(i) = f^{\)/f^{\), et de multiplier simplement les trames 

2' de N = 256 echantillons delivrees par le module 115 par la fenetre composee 
fQ avant d'effectuer la sommation a recouvrement. 

La figure 16 montre I'allure de la fenetre composee fQ dans le cas ou la 
15 fenetre d'analyse f^ est une fenetre de Hamming et la fenetre de synthese fg a 
la forme donnee par les relations (19) a (21). 

D'autres formes de la fenetre de synthese fg verifiant les reJations (19) 

et (20) peuvent etre employees. Dans la variante de la figure 17. c'est une 
fonction affine par morceaux definie par : 
20 f3<i) = A.i/L pour 0 < 1 < L (22) 

Afin d'ameliorer la qualite de codage du signal audio, le codeur de la 
figure 1 peut augmenter la cadence de formation et d'analyse des trames, afin 
de transmettre davantage de parametres de quantification au decodeur. Dans 
la structure de trame representee sur la figure 2, une trame de N = 256 

25 echantillons (32 ms) est formee toutes les 20 ms. Ces trames de 256 
echantillons pourraient etre formees a une cadence superieure, par exemple 
de 10 ms, deux trames successives ayant alors un decalage de M/2 = 80 
echantillons et un recouvrement de 176 echantillons. 

Dans ces conditions, on peut transmettre les jeux complets de 

30 parametres de quantification iF, icxs. icxi, lEm pxDur seulement un sous- 
ensemble des trames, et transmettre pour les autres trames des parametres 
permettant d'effectuer une interpolation adequate au niveau -du decodeur Dans 
Texemple envisage ci-dessus. le sous-ensemble pour lequel des jeux de 
parametres complets sont transmis peut etre constitue par les trames de rang 
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entier n, dont la periodicite est de M/Fg = 20 ms, et les trames pour lesquelles 
une interpolation est effectuee peuvent etre celles de rang demi-entier n + 1/2 
qui sent decalees de 1 0 ms par rapport aux trames du sous-ensemble. 

Dans la realisation illustree par la figure 18, les notations cx_q [n-1] et 
5 . cx_q[n] designent des vecteurs cepstraux quantifies determines, pour deux 
trames successives de rang entier. par le module de quantification 18 et/ou par 
le module de quantification 34. Ces vecteurs comprennent par exemple quatre 
coefficients cepstraux consecutifs chacun. lis pourraient egalement 
comprendre davantage de coefficients cepstraux. 

10 Un module 120 effectue une interpolation de ces deux vecteurs 

cepstraux cx_q[n-1] et cx_q[n], afin rfestimer une valeur intermediaire 
cxJ{n-1/2]. U interpolation effectuee par le module 120 peut etre une simple 
moyenne arithmetique des vecteurs cx_q[n-1] et cx_q[n]. En variante, le 
module 120 pourrait appliquer une formule tf interpolation plus sophistiquee, 

15 par exemple polynomiale, en se fondant egalement sur les vecteurs cepstraux 
obtenus pour des trames anterieures a la trame n-1. D'autre part, si plus tf une 
trame interpolee est intercalee entre deux trames consecutives de rang entier. 
{'interpolation tient compte de la position relative de cheque trame interpolee. 

A I'aide des moyens precedemment decrits, le codeur calcule 

20 egalement les coefficients cepstraux cx[n-1/2] relatlfs a la trame de rang demi- 
entier. Dans le cas de I'enveloppe superieure, ces coefficients cepstraux sont 
ceux fournis par ie module de TFR1 1 3 apres post-liftrage 1 5 (par exemple avec 
les memes coefficients de post-liftrage que pour la trame precedente n-1) et 
normalisation 16. Dans le cas de I'enveloppe inferieure, les coefficients 

25 cepstraux cx[n-1/2] sont ceux delivres par le module de TFRI 33. 

Un soustracteur 121 forme ia difference ecx[n-M2] entre les 
coefficients cepstraux cx[n-1/2] calcules pour la trame de rang demi-entier et 
les coefficients cxJ[n-1/2] estimes par interpolation. Cette difference est 
fournie a un module de quantification 122 qui adresse des index de 

30 quantification icx[n-1/2] au muitiplexeur de sortie 6 du codeur. Le module 122 
fonctionne par exemple par quantification vectorielle des erreurs rf interpolation 
ecx[n-1/2] successivement determinees pour les trames de rang demi-entier. 

Cette quantification de Terreur rf interpolation peut etre effectuee par le 
codeur pour chacun des NCS + NCI coefficients cepstraux utilises par le 

35 decodeur, ou seulement pour certains rfentre eux, typiquement ceux rfordres 
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les plus petits. 

Les moyens correspondants du decodeur sont illustres par la figure 19. 
Le decodeur fonctionne essentiellement comme celui decrit en reference a la 
figure 8 pour determiner les trames de signal de rang entier. Un module 

5 d' interpolation 124 identique au module 120 du codeur estime les coefficients 
intermediaires cxj[n-1/2] a partir des coefficients quantifies cx_q[n— 1] et 
cx_q[n] foumis par le module 47 et/ou le module 48 a partir des index icxs, icxi 
extraits du flux <!>. Un module rfextraction de parametres 125 regoit T index de 
quantification icx[n-1/2] depuis le demultiplexeur tf entree 45 du decodeur, et 

10 en deduit Terreur d' interpolation quantifiee ecx_q[n-1/2] a partir du meme 
dictionnaire de quantification que celui utilise par le module 122 du codeur. Un 
additionneur 126 fait la somme des vecteurs cepstraux cxJ[n-1/2] et 
ecx_q[h-1/2] afin de fournir les coefficients cepstraux cx[n-1/2] qui seront 
utilises par le decodeur (modules 51-57, 95, 96, 115 et/ou modules 85-87, 92. 

15 95, 96, 115) pour former la trame interpolee de rang n-1/2. 

Si certains seulement des coefficients cepstraux ont fait Tobjet d'une 
quantification d'erreur d' interpolation, les autres sont determines par le 
decodeur par une interpolation simple, sans correction. 

Le decodeur peut egalement interpoler les autres parametres Fq, Emix 

20 utilises pour synthetiser les trames de signal. La frequence fondamentale Fq 

peut etre interpolee lineairement, soit dans le domaine tempore!, soit (de 
preference) directement dans le domaine frequentiel. Pour r interpolation 
eventuelle du vecteur de ponderation energetique Emix. il convient d'effectuer 
r interpolation apres denormalisation et en tenant compte bien entendu des 

25 decalages temporels entre trames. 

II est a noter qu'il est particulierement avantageux, pour interpoler la 
representation des enveloppes spectrales, d'effectuer cette interpolation dans 
le domaine cepstral. Contrairement a une interpolation effectuee sur d'autres 
parametres, tels que les coefficients LSP (« Line Spectrum Pairs »), 

30 r interpolation lineaire des coefficients cepstraux correspond a r interpolation 
iineaire des amplitudes spectrales comprimees. 

Dans la variante representee sur la figure 20, le codeur utilise les 
vecteurs cepstraux cx_q[nl, cx_q[rv-1], cx_q[n-r] et cx_q{n-1/2] calcules 
pour les dernieres trames passees <t ^ 1 ) pour identifier un filtre interpolateur 

35 optimal qui, lorsqu'on lui soumet les vecteurs cepstraux quantifies cx_q{n-r]. 
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.... cx_q[n] relatifs aux trames de rang entier, delivre un vecteur cepstral 
interpole cx__i[n-1/2] qui presente une distance minimale avec le vecteur 
cx[n-1/2] calcule pour ia derniere trame de rang demi-entier. 

Dans I'exemple represente sur la figure 20, ce filtre interpoiateur 128 
5 est present dans le codeur, et un soustracteur 129 retranche sa sortie 
cx_i[n-1/2] du vecteur cepstral calcule cx[n-1/2]. Un module de minimisation 
130 determine le jeu de parametres {P} du filtre interpoiateur 128, pour lequel 
I'erreur d'interpolation ecx[n-1/2] delivree par le soustracteur 129 presente une 
norme minimale. Ce jeu de parametres {P} est adresse a un module de 
10 quantification 131 qui foumit un index de quantification correspondent iP au 
multiplexeur de sortie 6 du codeur. 

En fonction du debit alloue dans le flux O aux index de quantification 
des parametres {P} definissant le filtre interpoiateur optimal 128, on pourra 
adopter une quantification plus ou moins fine de ces parametres, ou une forme 
15 plus ou moins elaboree du filtre interpoiateur, ou encore prevoir plusieurs filtres 
interpolateurs quantifies de maniere distincte pour differents vecteurs de 
coefficients cepstraux. 

Dans une realisation simple, le filtre interpoiateur 128 est lineaire, avec 

r= 1 : 

20 cxJIn-1/2] = p.cx_q[n-1] + (1-p).cx_q[n] (23) 

et le jeu de parametres {P} se limite au coefficient p compris entre 0 et 1 . 

A partir des index iP de quantification des parametres {P} obtenus dans 
le flux binaire cp, le decodeur reconstruit le filtre interpoiateur 128 (aux erreurs 
de quantification pres), et traite les vecteurs spectraux cx_q[n-r], .... cx_q[n] 

25 afin d'estimer les coefficients cepstraux cx[n-1/2] utilises pour synthetiser les 
trames de rang demi-entier. 

De fa^on generale, le decodeur peut utiiiser une methode 
d'interpolation simple (sans transmission de parametres de la part du codeur 
pour les trames de rang demi-entier), une methode d'interpolation avec prise 

30 en compte d'une erreur d' interpolation quantifiee (selon ies figures 17 et 1 8), ou 
une methode d'interpolation avec un filtre interpoiateur optimal (selon la figure 
1 9) pour evaluer les trames de rang demi-entier en plus des trames de rang 
entier evaluees directement comme explique en reference aux figures 8 a 13. 
Le module 1 16 de synthase temporelle peut alors combiner I'ensemble de ces 

35 trames evaluees pour former le signal synthetise x de ia maniere expliquee ci- 
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apres en reference aux figures 14. 21 et 22. 

Comme dans la methode de synthese temporelle precedemment 
decrite, le module 116 effectue une somme a recouvrement de trames 
modifiees par rapport a celles successivement evaluees en sortie du module 
5 115, et cette modification peut etre vue en deux etapes dont la premiere est 
identique a celle precedemment decrite en reference a la figure 14 (diviser les 

echantillons de la trame 2' par la fenetre rfanalyse fA). 

La seconde etape (figure 21) consiste a multiplier les echantillons de la 

trame renormalisee 2" par une fenetre de synthese fs verifiant les proprietes 

10 suivantes : 

fs(i) = 0 pour 0 < i < N/2 - M/p et N/2 + M/p < i <N (24) 

4(0 + 40 + M/p) = A pourN/2^M/p<i<N/2 (25) 

ou A designe une constante positive arbitraire, par exemple A = 1, et p est 
rentier tel que le decalage temporel entre les trames successives (calculees 
15 directement et interpolees) soit de M/p echantillons, soit p = 2 dans I'exemple 

decrit. La fenetre de synthese fs(i) croit progressivement pour i allant de 

N/2 - M/p a N/2. Cest par exemple une sinusoide surelevee sur T intervene 

N/2 - M/p < i < N/2 + M/p. En particulier, la fenetre de synthese fs peut etre. 

sur cet intervene, une fenetre de Hamming (comme represents sur la figure 21 ) 

20 ou une fenetre de Manning. 

La figure 21 montre les trames successives 2" repositionnees dans le 
temps par le module 116. Les hachures indiquent les portions eliminees des 
trames (fenetre de synthese a 0). On voit qu'en effectuant la somme a 
recouvrement des echantillons des trames successives, la propriete (25) 

25 assure une ponderation homogene des echantillons du signal synthetise. 

Comme dans la methode de synthese illustree par les figures 14 et 15, 
la procedure de ponderation des trames obtenues par transformee de Fourier 
inverse des spectres Y peut etre effectuee en une seule etape, avec une 

fenetre composee fc(0 ='fs(OAA(')- La figure 22 montre la forme de la fenetre 

30 composee fc dans lecas ou les fenetres f^^et fs sont de type Hamming. 

Comme la methode de synthese temporeHe illustree par les figures 14 
a 17. celle illustree par les figures 14, 21 et 22 permet de prendre en compte 



wo 01/03116 




PCT/FROO/01904 



un recouvrement L entre deux trames d' analyse (pour lesquelles T analyse est 
effectuee de fagon complete) plus petit que la moitie que la taille N de ces 
trames. De fagon generale, cette derniere methode est applicable lorsque les 
trames d'analyse successives presentent des decalages temporels mutuels M 
5 de plus de N/2 echantillons (meme eventuellement de plus de N echantillons si 
un tres bas debit est requis), T interpolation conduisant a un ensemble de 
trames dent les decalages temporels mutuels sent de moins de N/2 
echantillons. 

Les trames interpolees peuvent faire Tobjet rfune transmission reduite 
10 de parametres de codage, comme decrit precedemment, mais cela n'est pas 
obiigatoire. Ce mode de realisation permet de conserver un intervalle M 
relativement grand entre deux trames d'analyse, et done de limiter le debit de 
transmission requis, tout en limitant les discontinuites susceptibles d'apparaitre 
en raison de la taille de cet intervalle par rapport aux echelles de temps 
15 typiques des variations des parametres du signal audio, notamment les 
coefficients cepstraux et la frequence fondamentale. 
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REVENDICATIONS 



1. Procede d'analyse d'un signal audio (x) traite par trames 

successives de N echantillons, dans lequel on pondere les echantillons de 
chaque trame par une fenetre d'analyse (f^) de type Hamming, Manning, 
5 Kaiser ou analogue, on calcule un spectre du signal audio en transformant 
chaque trame d'echantillons ponderes dans le domaine frequentlel. et on traite 
ie spectre du signal audio pour delivrer des parametres (cx^sup. cxjnf, Emix) 
de synthese d'un signal derive du signal audio analyse, caracterise en ce que 
les trames successives comportent une alternance de trames pour lesquelles 
10 on delivre des jeux complets de parametres de synthese et de trames pour 
lesquelles on delivre des jeux incomplets de parametres de synthese. et en ce 
que les trames successives pour lesquelles on delivre des jeux complets de 
parametres de synthese presentent des recouvrements mutueJs de moins de 
N/2 echantillons. 

15 2. Procede selon la revendication 1, dans lequel les jeux incomplets de 

parametres de synthese incluent des donnees (icx[n-1/2]) representant une 
erreur (ecx[n-1/2]) d'interpolation d'au moins un des parametres de synthese. 

3. Procede selon la revendication 1, dans lequel les jeux incomplets de 
parametres de synthese incluent des donnees (iP) representant un filtre (128) 

20 d'interpolation d'au moins un des parametres de synthese. 

4. Procede selon Tune quelconque des revendications 1 a 3, dans 
lequel le traitement du spectre du signal audio (x) comporte une extraction de 
parametres de codage (cx_sup, cxJnf, Emix) en vue de la transmission et/ou 
du stockage du signal audio code. 

25 5. Procede selon Tune quelconque des revendications 1 a 3, dans 

lequel le traitement du spectre du signal audio (x) comporte un debruitage par 
soustraction spectrale. 

6. Dispositif de traitement audio, comprenant des moyens d'analyse 

pour executer un procede selon Tune quelconque des revendications 1 a 5. 
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7. Procede de synthese d'un signal audio, dans lequel on obtient des 

estimations spectrales successives (Y) correspondant respectivement a des 
trames de N echantillons du signal audio ponderes par une fenetre d'analyse 
(f^). les trames successives presentant des recouvrements mutuels de L 

5 echantillons, on evalue chaque trame du signal audio en transformant les 
estimations spectrales dans le domaine temporal, et on combine les trames 
evaluees pour former le signal synthetise (x), caracterise en ce qu'on modifie 
chaque trame evaluee en lui appliquant un traitement correspondant a une 
division par ladite fenetre d'analyse (f;^) et a une multiplication par une fenStre 
10 de synthese (fg), et on forme le signal synthetise comme une somme a 

recouvrement des trames modifiees, et en ce que, le nombre L etant plus petit 
que N/2 et les echantillons d'une trame ayant des rangs i numerotes de 0 a 
N-1 , la fenetre de synthese fgCi) verifie fs{N-L+i) + fs(i) = A pour 0^ i < L, et 
est egale a A pour L ^ i < N-L, A etant une constante positive. 

15 8. Procede selon la revendlcation 7, dans lequel la fen§tre de synthese 

fs(i) crott de 0 a A pour i allant de 0 ^ L 

9. Procede selon ia revendlcation 8, dans lequel la fenetre de synthese 
f3(i) pour 0 ^ i < L est une deml-sinusoTde surelevee. 

10. Proced6 de synthese d'un signal audio, dans lequel on evalue un 
20 ensemble de trames recouvrantes successives de N echantillons du signal 

audio ponderes par une fenetre d'analyse (f^^), en transformant dans le 

domaine temporel des estimations spectrales (Y) correspondant 
respectivement auxdites trames, et on combine les trames evaluees pour 
former le signal synthetise (x), caracterise en ce que, pour un sous-ensemble 

25 des trames evaluees, les estimations spectrales sont obtenues en traitant des 
parametres de synthese (cx_sup_q, cx_lnf_q, Emix) respectivement associes 
aux trames dudit sous-ensemble tandis que, pour les trames ne faisant pas 
partie du sous-ensemble, les estimations spectrales sont obtenues avec une 
interpolation d'une partie au moins des parametres de synthese, en ce que les 

30 trames successives dudit sous-ensemble presentent des d^calages temporals 
mutuels de M echantillons, ie nombre M etant plus grand que N/2, tandis que 
les trames successives dudit ensemble presentent des decalages temporals 




wo 01/031 16 PCTyFROO/01904 

-33- 

mutuels de M/p echantillons. p etant un entier plus grand que 1. en ce qu'on 
modifie chaque trame evaluee en lui appliquant un traitement correspondant a 
une division par ladite fenetre d'analyse (f^) et a une multiplication par une 

fenetre de synthese (fs ), et on forme le signal synthetise comme une somme a 
5 recouvrement des trames modifiees. et en ce que. les echantillons d'une trame 
ayant des rangs i numerotes de 0 a N-1, la fenetre de synthese fs(i) a un 
support limlte aux rangs i allant de N/2 - M/p a N/2 + M/p et verifie 
^s(0 fs(" +M/p) = A pour N/2 - M/p < i < N/2, A etant une constante positive. 

11. Precede selon la revendication 10, dans lequel ia fenetre de 
10 synthese fs(i) croit pour i allant de N/2 - M/p a N/2. 

12. Precede selon la revendication 11, dans lequel la fenetre de 
synthese fs(i) pour N/2 - M/p < i < N/2 + M/p est une sinusoTde surelevee. 

13. Precede selon Tune quelconque des revendications 10 a 12. dans 
lequel des donnees (icx_q[n-1/2]) representant une erreur ^interpolation 

15 (ecx_q[n-1/2]) sont associees aux trames ne faisant pas partie dudit sous- 
ensemble, et sont utilisees pour corriger au moins un des parametres de 
synthese interpoles (cxJ[n-1/2]). 

14. Precede selon Tune quelconque des revendications 10 a 12, dans 
lequel des donnees (iP) representant un filtre interpolateur (128) sont 

20 associees aux trames ne faisant pas partie dudit sous-ensemble, et sont 
utilisees pour interpoler au moins un des parametres de synthese. 

15. Precede selon Tune quelconque des revendications 10 a 14, dans 
lequel les parametres de synthese comprennent des coefficients cepstraux 
(cx[n]) soumis a T interpolation. 

25 16. Dispositif de traitement audio, comprenant des meyens de synthese 

pour executer un precede selon Tune quelconque des revendications 7 a 15. 
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